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1 In aller Kürze 


Eine deskriptive, konsequent korpuslinguistisch fundierte und an das Fach- 
publikum gerichtete Grammatik des Deutschen gibt es bisher nicht. Es wird sie 
auch noch nicht so schnell als abgeschlossenes Werk geben, denn die Aufgabe 
ist enorm, wenn man sich zum Ziel setzt, mit modernen korpuslinguistischen 
Methoden die Vielfalt und Variabilität der deutschen Grammatik in großer 
Detailschärfe zu erfassen, und gleichzeitig für die Validierbarkeit der Ergeb- 
nisse sorgen will. Zeitnah möglich ist aber die Erarbeitung einzelner Bausteine 
einer solchen Grammatik. Mit den „Bausteinen einer Korpusgrammatik des 
Deutschen“ werden nach und nach korpusgestützte Untersuchungen im Open- 
Access-Format vorgelegt, die als einzelne Kapitel einer neuen wissenschaftlichen 
Grammatik des Deutschen gestaltet sind. Die Idee der „Bausteine“ ist im Pro- 
jekt „Korpusgrammatik - grammatische Variation im standardsprachlichen und 
standardnahen Deutsch“! des Leibniz-Instituts für Deutsche Sprache in Mann- 
heim (IDS) entwickelt worden. Die „Bausteine“ entstehen am IDS und werden 
in Kooperation mit dem Germanistischen Seminar der Universitat Heidelberg 
unter Trägerschaft des Europäischen Zentrums fiir Sprachwissenschaften (EZS) 
herausgegeben. Die Reihe setzt sich dabei das ausdrückliche Ziel, einen Beitrag 
zur offenen Wissenschaft im Sinne der Open-Science-Bewegung zu leisten, 
indem Bestandteile des wissenschaftlichen Prozesses frei zugänglich und auch 
nachnutzbar gemacht werden: Neben Texten in Form von Grammatikkapiteln 
werden Ergebnisse korpuslinguistisch-statistischer Analysen und bei ausge- 
wählten Themen die zugrunde liegenden Sprachdaten veröffentlicht. Geplant 
sind jährlich bis zu zwei Ausgaben jeweils in einer Online- und einer Print-on- 
Demand-Version. Bei der Qualitätssicherung werden die Herausgebenden der 


1 Vgl. https://www.ids-mannheim.de/gra/projekte/korpusgrammatik.html, abgerufen 
am 27.12.2019. 
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„Bausteine“ durch den Wissenschaftlichen Beirat unterstützt, der u.a. für die 
Begutachtung der Beiträge sorgt. 


2 Warum braucht man eine neue wissenschaftliche 
Grammatik des Deutschen? 


In der neueren wissenschaftlichen Grammatikschreibung zum Gegenwarts- 
deutschen hat sich ein besonderes Paradigma herauskristallisiert. Demnach sol- 
len Grammatikwerke deskriptiv und gleichzeitig theoretisch fundiert sein, ohne 
jedoch dabei nur einer Theorie folgen zu müssen (vgl. z.B. Eisenberg 2013a: 7). 
Ein gewisser theoretischer Eklektizismus scheint sowieso notwendig zu sein, 
wenn man eine konsequente Deskription anstrebt, da Theorien nicht lückenlos 
sind (dazu Hoffmann 1997: 4). Im Zweifelsfall sollman versuchen, dem grammati- 
schen Phänomen und nicht einer bestimmten Theorie gerecht zu werden. Diesen 
Ideen fühlen sich auch die Autor/inn/en der „Bausteine“ verpflichtet. Allerdings 
gibt es bereits einige Grammatiken, in denen eine weitgehend theorieneutrale 
Deskription beherzigt wird (dazu z.B. Paranhos Zitterbart 2010: 67-70, Eisen- 
berg 2013a: 1-2). Warum soll also eine weitere wissenschaftliche Grammatik des 
Deutschen entstehen? 

In den folgenden Ausführungen werden einige ausgewählte Grammatiken 
besonders häufig als Beispiele herangezogen. Es sind dies die Dudengrammatik 
(2016), der „Grundriss der deutschen Grammatik“ von Eisenberg (2013a, 2013b), 
die „Grammatik der deutschen Sprache“ (GDS) von Zifonun et al. (1997) und die 
„Grammatik des Deutschen im europäischen Vergleich“ (GDE) von Gunkel et al. 
(2017). Zu betrachten ist zunächst, an wen sich diese Werke richten. Im popu- 
lärsten, der Dudengrammatik, die als einzige das Prädikat wissenschaftlich nicht 
für sich beansprucht, werden als Einsatzorte Schulen und Universitäten und als 
Zielgruppe beruflich mit Sprache Beschäftigte, persönlich an sprachlichen Fra- 
gen Interessierte sowie Lehrende und Lernende des Deutschen als Fremdsprache 
genannt (Dudengrammatik 2016: 5). Eisenberg (2013a: IX-X) empfiehlt seine 
Grammatik als Lehrbuch und hebt unter ihrer Leserschaft Studierende hervor. 
Hoffmann (1997: 2) sieht die Zielgruppe der GDS in Sprachinteressierten mit 
Vorkenntnissen: Linguisten, Akademikern aus Nachbardisziplinen, Lehrenden 
und Studierenden. In der GDE (2017: ı) schließlich werden sprachwissenschaft- 
liche Vorbildung, aber keine speziellen grammatiktheoretischen Kenntnisse vor- 
ausgesetzt. Man könnte hier eine von Werk zu Werk zunehmende Spezialisie- 
rung der Kenntnisse herauslesen, die von den Adressierten erwartet werden. Der 
nächste Schritt wäre es, direkt die Sprachwissenschaftler/innen zum anvisierten 
Kernpublikum zu erklären. 
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Ein Bekenntnis zu einem solchen Schritt ist aus unserer Sicht im Sinne 
des wissenschaftlichen Fortschritts notwendig. So soll die neueste Auflage der 
Dudengrammatik (2016) dem Vorwort zufolge den heutigen Stand des Wissens 
über Formen und Funktionen der deutschen Standardsprache präsentieren, 
und sie erreicht tatsächlich einen Grad an deskriptiver Präzision und theore- 
tischer Durchdringung, der auch einer deklariert wissenschaftlichen Gramma- 
tik gut zu Gesicht stünde. Doch als traditionelles Nachschlagewerk „für alle“ 
muss die Dudengrammatik den Spagat zwischen deskriptiver Adäquatheit und 
Allgemeinverständlichkeit, zwischen Deskription und Normierung versuchen. 
Autor/inn/en rein wissenschaftlicher Grammatiken dagegen brauchen sich um 
die Allgemeinverständlichkeit nicht so große Sorgen zu machen und dürfen die 
Normierung sogar - so der Konsens der allermeisten Linguist/inn/en - gar nicht 
anstreben (dazu differenziert Hoffmann 1997: 6, Habermann 2010: 11-12, Eisen- 
berg 2013a: 8-10). Unter den Grammatiken mit wissenschaftlichem Anspruch 
gibt es einige, in denen explizit didaktische Zwecke verfolgt werden (z.B. Eisen- 
berg 2013a, 2013b, tendenziell Hentschel & Weydt 2013 und Engel 2009). Es gibt 
aber auch welche, in denen die Grammatikbeschreibung mit weniger Rücksicht 
auf die Didaktik betrieben wird (z.B. GDS, GDE). Gäbe es darunter Grammati- 
ken, die sich explizit an Sprachwissenschaftler/innen als Kernpublikum richte- 
ten, so hätten ihre Autor/inn/en endgültig die Berechtigung, die Grenzen der 
grammatikografischen Deskription auszureizen. Sie könnten es auch zu einem 
ihrer zentralen Ziele erklären, mit der tiefer gehenden Beschreibung direkte 
Anknüpfungspunkte für Spezialforschung zu bieten, die den wissenschaftlichen 
Fortschritt noch weiter vorantreibt. 

Eine Steigerung der Deskriptionstiefe, die in größerer Detailschärfe resul- 
tiert, passt also nicht nur zum Konzept einer deskriptiven Grammatik, sie ist 
auch dem wissenschaftlichen Fortschritt zuträglich. Sie lässt aber den Umfang 
einer Grammatik anwachsen und kann in der Praxis der Werkerstellung auf Kos- 
ten der Vollständigkeit gehen, die oft von Grammatiken erwartet wird. Aller- 
dings ist das Vollständigkeitspostulat in seiner Absolutheit ohnehin utopisch, 
sodass sich wissenschaftliche Grammatiken mit mehr oder weniger fragmenta- 
rischen Lösungen begnügen müssen (dazu Hoffmann 1997: 4). Unter den weiter 
oben genannten Grammatiken sind die GDS und die GDE besonders umfang- 
reich. Sie bestechen auch durch eine besondere Detailschärfe (zur GDS vgl. z.B. 
Paranhos Zitterbart 2010: 70) und eine beeindruckende theoretische Fundiert- 
heit. Sie weisen aber zwangsläufig Lücken auf oder behandeln nur Teilbereiche.’ 


2 Hoffmann (1997: 11) weist in der Einführung der GDS u.a. auf das Fehlen „eine[r] 
wirklich ausgearbeitete[n] Morphosyntax“ und einer Behandlung der deutschen 
Wortbildung hin. Die GDE (2017: ı) ist zunächst nur als Grammatik des Nominals 
angelegt. 
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In beiden Grammatiken wird die Zielgruppe zwar noch nicht entsprechend ein- 
geschränkt, jedoch kommen sie in der Praxis unserem Postulat einer Gramma- 
tik für Sprachwissenschaftler/innen schon sehr nahe. Dabei ist die GDE 2017 
erschienen und damit ziemlich aktuell. Die Autor/inn/en nehmen darin aller- 
dings eine spezielle Perspektive ein, die auf die Grammatik des Deutschen im 
Vergleich mit europäischen Kontrastsprachen ausgerichtet ist, und beschreiben 
dabei nur nominale Kategorien und Konstruktionen. Die GDS wiederum kon- 
zentriert sich zwar auf das Deutsche allein und bietet dabei eine überaus breit 
angelegte Beschreibung, sie ist aber bereits vor 23 Jahren erschienen. Was also 
offensichtlich fehlt, ist eine Grammatik, die einerseits dadurch, dass sie nur das 
Deutsche in den Fokus nimmt, ein entsprechend höheres Maß an Deskriptions- 
breite und -tiefe erreichen kann und die andererseits einen Beitrag im aktuellen 
Forschungsdiskurs darstellt. 

Warum ist die Aktualität so wichtig? Es liegt zunächst auf der Hand, dass die 
Forschung nicht stillsteht und immer wieder neue Erkenntnisse hervorbringt, 
die auch in wissenschaftliche Grammatiken einfließen sollen. Es ist außerdem 
zu prüfen, ob in neuester Zeit nicht sprachliche Entwicklungen stattgefunden 
haben, die zu Phänomenen geführt haben, die in wissenschaftlichen Grammati- 
ken noch nicht beschrieben sind. Und schließlich sind in der grammatischen 
Beschreibung neue Forschungsparadigmen zu berücksichtigen, die bisher in 
Grammatiken noch nicht angewendete Methoden, noch nicht eingenommene 
Blickwinkel und noch nicht erörterte Fragestellungen relevant machen. So 
wurde in der grammatischen Forschung der letzten Jahrzehnte die empirische 
Fundierung immer wichtiger. Wesentlich dazu beigetragen hat die rasante Wei- 
terentwicklung von Sprachkorpora, die computerbasiert aufgebaut, aufbereitet, 
bereitgestellt, durchsucht sowie analysiert werden und heute zum Teil Größen 
von Milliarden von Wörtern erreichen können. Was die Arbeit mit Korpora 
dabei anderen Empiriearten wie Befragung oder Experiment voraushat, ist 
neben der potenziell sehr großen Menge an Sprachdaten deren natürlichere 
Entstehungssituation (vgl. Konopka 2018: 152-153). Übrigens verstehen sich 
schon alle weiter oben aufgezählten Grammatiken als empirisch orientiert. Die 
Dudengrammatik (2016), die GDS und die GDE nutzen auch in größerem Maße 
Korpora.’ Sie ziehen sie vor allem als Quelle für Belege heran, die theoretische 
Feststellungen exemplifizieren. In der neueren grammatischen Forschung 
werden Korpora hingegen immer häufiger dazu benutzt, theoretische Feststel- 
lungen systematisch zu evaluieren (vgl. Meurers & Müller 2009). Sie werden 
außerdem zunehmend als Quelle für erklärungsbedürftige Phänomene und neue 


3 Eisenberg (2013a: 9) dagegen äußert sich kritisch zum konsequenten ,Datensam- 
meln“, das sich schnell verselbständige und damit das Entstehen einer Grammatik 
verhindere. 
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Fragestellungen exploriert.* Korpusorientierte Grammatikforschung heißt also 
heute Untersuchung großer Mengen authentischen, elektronisch durchsuch- 
baren und mit Metadaten angereicherten Textmaterials. Sie hat in den letzten 
Jahren über Einzelphilologien hinweg zu einer regelrechten Welle interessanter 
Studien geführt (vgl. z.B. die Beiträge in Konopka et al. 2011 und Fuß et al. 2018). 
In der Grammatikografie des Englischen hat sie auch bereits vor einiger Zeit 
ihren Niederschlag in korpusgestützten Grammatiken gefunden, etwa der 
„Cambridge Grammar of English“ von Carter & McCarthy (2006) und vor allem 
der „Longman Grammar of Spoken und Written English“ von Biber et al. (2006 
[1999]).” In der Germanistik jedoch wurde dieser Ansatz bisher nur im Rahmen 
von kleineren Studien und Monografien bzw. von Untersuchungen zu überschau- 
baren Grammatikausschnitten verfolgt. Eine breit angelegte Grammatik des 
Deutschen auf korpuslinguistischer Basis stellt immer noch ein Desiderat dar. 
Korpuslinguistik ermöglicht genauere, detailliertere Deskription. Besiegelt 
ist damit nicht nur die endgültige Abwendung von der normativen Grammatik 
oder von einer Grammatik, die einen einheitlichen Sprachgebrauch vorgaukelt. 
Unausweichlich ist jetzt konsequenterweise auch die Hinwendung zu einem 
Grammatikkonzept, gemäß dem die Sprache in ihrem ganzen Facettenreichtum, 
ihrer Variabilität und in ihrem tatsächlichen Gebrauch beschrieben werden soll 
(vgl. Conrad 2010: 228). Variation ist mittlerweile zu einem der zentralen The- 
men der Grammatikschreibung geworden, während das Konzept der Standard- 
sprache an Bedeutung eingebüßt hat bzw. jetzt anders gedacht werden muss 
(dazu Eichinger 2017: v.a. 17-19, Felder 2016: 23-26). Von einer neuen, kor- 
puslinguistisch fundierten Grammatik des Deutschen ist in diesem Kontext zu 
erwarten, dass sie die Variation nicht nur festhält, sondern auch im Hinblick auf 
ihre Abhängigkeit von verschiedenen sprachinternen und/oder -externen Ein- 
flussfaktoren erklärt (vgl. Konopka 2018: 166).° Dies stellt besondere Anforde- 
rungen an die Methodik der Untersuchungen, die der Grammatikbeschreibung 
zugrunde liegen. Die Bedeutung korpuslinguistisch-statistischer Verfahren, mit 
denen man die Datenfülle und -vielfalt zu fassen bekommen kann, wächst. Die 
Anwendung statistischer Verfahren verpflichtet dabei schon dazu, die Daten- 
erhebung, -aufbereitung und -analyse für die Leserschaft zu dokumentieren, 
was sich sehr gut in das Konzept einer wissenschaftlichen Grammatik einfügt, 
die die Validierbarkeit der zugrunde liegenden Untersuchungen sichert. Damit 
wird die direkte Anschlussforschung ermöglicht, die unter Umständen sogar 


4 Zur Evidenz aus dem Korpus, Validierung am Korpus und Induktion mithilfe des Kor- 
pus vgl. Konopka (2018: 151-164). 

5 Zur kritischen Diskussion vgl. Mukherjee (2006). 
Felder (2016: v.a. 7-19) zeigt instruktiv die Möglichkeiten, sprachliche Variation im 
Allgemeinen zu beschreiben und zu erfassen. 
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mit vergleichbaren Methoden und denselben sprachlichen Daten betrieben wer- 
den kann. 

Die „Bausteine“ sollen es möglich machen, nach und nach eine wissenschaft- 
liche Grammatik „aufzubauen“, die dem skizzierten Bedarf gut begegnen kann. 
Sie wird im Weiteren als Korpusgrammatik bezeichnet. 


3 Eine Korpusgrammatik in spe 


Die ersten konzeptionellen Überlegungen zu einer Korpusgrammatik wurden in 
Bubenhofer et al. (2014) vorgestellt. Von 2011 bis 2019 entstand am IDS außerdem 
eine Reihe von Pilotstudien, in denen anhand detaillierter Untersuchungen von 
Variationsphänomenen aus verschiedenen Grammatikbereichen exemplarische 
Fragestellungstypen und dazu passende korpuslinguistische Herangehenswei- 
sen herausgearbeitet wurden. Einen Überblick über diese Arbeiten geben Fuß 
et al. (2019). Nun werden die ersten Versionen von Kapiteln der künftigen Kor- 
pusgrammatik als „Bausteine“ vorgestellt. Es handelt sich dabei gewissermaßen 
um Probekapitel - die Anlage der Kapitel und die Darstellungsformen werden 
sich mit weiteren „Bausteinen“ weiterentwickeln: Es muss ja einiges ausprobiert 
werden, denn die Korpusgrammatik hat auch Neues vor. Zu beginnen ist aber mit 
den eher traditionellen Rahmeninformationen. 

Gegenstand der Korpusgrammatik ist die Grammatik des geschriebenen 
Deutsch, wie es sich in Texttypen manifestiert, die Standardsprachliches erwar- 
ten lassen (vgl. Bubenhofer et al. 2014: 23-32). Der besondere Fokus liegt auf 
der Variation. Den grammatischen Gegenstandsbereich bilden Morphologie und 
Syntax, zuzüglich der Ausschnitte benachbarter Gebiete (Phonologie und Gra- 
phematik einerseits, „Textgrammatik“ andererseits), die morphologische und 
syntaktische Variation direkt begründen oder beeinflussen. Die Korpusgramma- 
tik strebt eine empirisch fundierte Deskription an und stützt sich dabei haupt- 
sächlich auf das sogenannte Untersuchungskorpus, das ein speziell aufbereitetes 
Teilkorpus des Deutschen Referenzkorpus (DeReKo, vgl. Kupietz et al. 2018)’ 
darstellt (Genaueres in Abschnitt 5 weiter unten). Das primär anvisierte Publi- 
kum der Korpusgrammatik sind Sprachwissenschaftler/innen. 

Da es offenkundig utopisch ist, die gesamte Grammatik einer Einzelsprache 
in ihrer Breite und Tiefe zu erfassen, wurden in der obigen Kurzcharakteristik 
für die Korpusgrammatik von vorn herein gewisse Einschränkungen vorgenom- 
men. In der Tradition neuerer Grammatiken beschränken wir uns auf das Stan- 
darddeutsche. Zwei weitere Einschränkungen sind durch die korpuslinguistische 


7 Siehe auch https://www.ids-mannheim.de/kl/projekte/korpora.html (abgerufen am 
29.11.2019). 
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Herangehensweise mitbedingt. Die eine ist medialer Natur: Die empirisch fun- 
dierte Deskription beschränkt sich auf das geschriebene Deutsch. Ein wichtiger 
Grund dafür ist, dass es sehr umfangreiche, inzwischen auch ausdifferenzierte 
und gut aufbereitete Korpora des geschriebenen Deutsch gibt, aber noch keine 
vergleichbaren Sammlungen des gesprochenen Deutsch.’ Die andere Einschrän- 
kung resultiert aus der Umgewichtung der grammatischen Themen und Pers- 
pektiven, wie sie in Abschnitt 2 beschrieben wurde: Besondere Aufmerksamkeit 
gilt grammatischer Variation. Selbstverständlich wird dabei davon ausgegangen, 
dass die Standardsprache Variation zulässt. So sollen sich die behandelten Phä- 
nomene auf das Standarddeutsche beziehen, da aber die Abgrenzung der Stan- 
dardsprache ein Problem an sich darstellt (vgl. Bubenhofer et al. 2014: 21-32), 
werden zuweilen auch Übergänge zum Substandard ausgeleuchtet. Um solche 
Übergänge zu erfassen, werden ergänzend zum Untersuchungskorpus diejeni- 
gen Teilkorpora des Web-Korpus DECOW 16 (Schäfer & Bildhauer 2012; Schäfer 
2015) herangezogen, die „Grenzwertiges“ erwarten lassen. Im Weiteren soll sich 
die Korpusgrammatik weitgehend auf die Morphologie (Wortbildung und Fle- 
xion) und Syntax beschränken. Ein zentraler Grund für diese Einschränkung 
sind Machbarkeitsüberlegungen. Ausgewählt wurden mit Morphologie und 
Syntax aber Gebiete, die traditionell als Kernbereiche der Grammatik aufgefasst 
werden. Zuallerletzt führt die Tatsache, dass sich die Korpusgrammatik primär 
an Sprachwissenschaftler/innen richtet, zusammen mit der Priorisierung der 
Variation dazu, dass Phänomene, die schwer zu erklären bzw. in der Forschung 
umstritten sind, „einfachere“ und durch wissenschaftlichen Konsens geprägte 
Themen in den Hintergrund drängen bzw. im Falle von unstrittigen „Basics“ 
manchmal ganz verschwinden lassen. 

Wie von einer empirisch fundierten Grammatik dieser Art zu erwarten, wird 
sich die Korpusgrammatik zunächst an Oberflächenphänomenen orientieren. Die 
zugrunde liegenden Untersuchungen von Variationsphänomenen werden unter 
Suspendierung des Konzepts „freie Variation“ durchgeführt, wobei versucht 
wird, inner- und außergrammatische Einflussgrößen der Variation zu ermitteln. 
Die Ermittlung ersterer soll grundlegend durch Korpusannotationen nach gram- 
matischen Merkmalen ermöglicht werden, die Erfassung letzterer durch Doku- 
mentmetadaten, die die Korpora etwa nach zentralen Textklassen (Registern), 
geografisch oder zeitlich strukturieren. Trotz der primären Orientierung an 
Oberflächenphänomenen werden durchaus theoretische Erklärungen anvisiert, 


8 Zum geschriebenen Deutsch (insbesondere in den Druckmedien) sind außer DeReKo 
vor allem die Korpora des Digitalen Wörterbuchs der deutschen Sprache (DWDS) zu 
nennen (vgl. https://www.dwds.de/d/korpora, abgerufen am 20.6.2020). Ein Beispiel 
für ein im Aufbau begriffenes ausdifferenziertes Korpus der gesprochenen Sprache ist 
Folk (vgl. http://agd.ids-mannheim.de/folk.shtml, abgerufen am 26.5.2020). 
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und es wird theoretische Fundiertheit angestrebt, allerdings ohne die Theorie- 
neutralität aus den Augen zu verlieren. Letztere ist überhaupt die Voraussetzung 
dafür, dass die Korpusgrammatik von einem breiteren Fachpublikum umfassend 
benutzt werden kann. Einem solchen Publikum soll sie nämlich nicht nur Inter- 
pretationen sprachlicher Daten liefern. Sie soll auch quantitative Übersichten 
und differenzierte Datensammlungen bereitstellen, auf denen theoretische For- 
schung verschiedener Prägung aufsetzen kann. Außerdem hat sie so beschaf- 
fene Voruntersuchungen von Variationskontexten zu liefern, dass die empirische 
Spezialforschung direkt daran anschließen kann, auch wenn sie in spezielleren 
Frameworks oder mit anderen Methoden arbeitet. 

Die Korpusgrammatik zeigt sich in noch einem Bereich anders als die bishe- 
rigen Grammatiken. So beeinflusst die Benutzung korpuslinguistischer Metho- 
den die Inhalte und die Anlage der Grammatikkapitel. Diesen liegen oft statis- 
tische Untersuchungen zugrunde, die transparent dargestellt sein müssen, um 
methodisch nachvollziehbar zu sein, eine Bewertung der statistischen Befunde 
zuzulassen und idealerweise Replikation zu erlauben. Eine adäquate Darstel- 
lung von Ergebnissen solcher Untersuchungen führt dazu, dass viele Kapitel der 
Korpusgrammatik stärker durch methodische Argumentation geprägt sind und 
einen weniger deklarativen Stil aufweisen als für andere Grammatiken üblich. 
Dafür sind sie auch stärker problemlösungsorientiert und zwar in dem speziellen 
Sinne, dass sie nicht nur das Resultat zeigen, sondern auch den Weg zur Erkennt- 
nis nachzeichnen, was dem forschenden Publikum nur entgegenkommen kann. 

So hat die Korpusgrammatik zwar einige Unterschiede zu den in Abschnitt 2 
genannten Grammatiken des Deutschen aufzuweisen, dennoch sind diese für die 
Korpusgrammatik einerseits Fundament und andererseits eine große Inspirati- 
onsquelle. Sie sind eine Fundgrube des grammatischen Wissens, das als weitge- 
hend gesichert gilt. Sie liefern mit ihren Beschreibungen auch Ausgangspunkte 
für Vertiefungen und laden zur Evaluation und Weiterentwicklung von Gene- 
ralisierungen ein. Sie bleiben in vielerlei Hinsicht - etwa bei den Darstellungs- 
formen, der präzisen Sprache und dem grammatikografischen Duktus - ein Vor- 
bild. Letztlich machen sie es möglich, dass die Korpusgrammatik als Handbuch 
für Sprachwissenschaftler/innen mehr in die Tiefe gehen und sich nicht nur der 
Präsentation von bereits Bekanntem, sondern auch verstärkt der Problemlösung 
widmen kann. 


4 Warum „Bausteine“? 


Vom Beginn der Arbeiten an war allen Beteiligten klar, dass sehr viel Zeit ver- 
gehen wiirde, bis eine Grammatik mit diesen Anspriichen als umfassendes Buch 
vorgelegt werden könnte, und es sprachen mehrere gewichtige Argumente 
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dagegen, mit der Publikation der Teilergebnisse zu warten, bis die gesamte Kor- 
pusgrammatik auf einmal erscheinen kann. 

Wie andere Grammatiken kann auch die Korpusgrammatik nie wirklich voll- 
ständig werden - besonders offensichtlich wird dies angesichts der Ziele, die 
Methodik nachvollziehbar zu gestalten und auf die Deskriptionstiefe zu setzen 
(die im Prinzip vor keiner natürlichen Grenze haltmachen muss). Es ist sinnvoll, 
sich nicht nur damit abzufinden, sondern sich an den Umstand auch anzupassen: 
Da eine Grammatik mehr oder weniger fragmentarisch bleiben muss und sowieso 
immer ergänzt werden kann, spricht wenig dagegen, die Korpusgrammatik von 
vornherein in nach und nach erscheinenden Einzelteilen, sprich Bausteinen, zu 
veröffentlichen, die sich mit der Zeit zu einem immer vollständigeren (aber nie 
gänzlich vollständigen) Bild der deutschen Grammatik zusammensetzen. 

Die zeitnahe Veröffentlichung von Grammatikkapiteln sichert deren Aktua- 
lität. Die ihnen zugrunde liegenden Untersuchungen orientieren sich am aktuel- 
len Forschungsstand, und ihre Ergebnisse sind eigentlich Beiträge im laufenden 
Forschungsdiskurs. In einigen Jahren allerdings werden die Untersuchungen 
ihre innovative Wirkung verloren und die Ergebnisse an Aktualität eingebüßt 
haben. Im ungünstigsten Fall werden die Ergebnisse schon überholt sein, wenn 
man mit ihrer Veröffentlichung darauf wartet, bis alle vorgesehenen Kapitel der 
Grammatik vorliegen. Das spricht für die „Zwischenveröffentlichung“ bereits 
erstellter Kapitel. 

Wird im Team gearbeitet, übernehmen einzelne Autor/inn/en typischer- 
weise verschiedene thematische Bereiche. Sie bearbeiten sie dann oft parallel. 
Die Grammatik entsteht also nicht unbedingt linear entlang einer angestrebten 
Gliederung. Die einzelnen Kapitel können außerdem - auch wenn man eine for- 
male und inhaltliche Einheitlichkeit anstrebt - spürbar durch die Persönlichkeit 
der jeweiligen Autor/inn/en geprägt sein.’ Beides begründet oft eine gewisse 
Eigenständigkeit der Kapitel, die zu ihrer separaten Publikation in den „Bau- 
steinen“ gut passt. Die Kapitel, die für eine Ausgabe der „Bausteine“ ausgewählt 
werden, müssen nicht thematisch zusammenhängen. Auch eignen sich nicht 
alle Kapitel dafür, in die „Bausteine“ aufgenommen zu werden. Die Kriterien, 
nach denen Kapitel für die „Bausteine“ ausgesucht werden, sind ein ausreichen- 
der linguistischer Informationsgehalt und eben gerade ein gewisses Maß an 
Eigenstandigkeit.*° 


9 Vgl. die Erfahrungen der Autor/inn/en der GDE (2017: 8). 

10 So dienen manche Überblickskapitel (vgl. Abschnitt 5) nicht so sehr der linguistischen 
Beschreibung wie einer Vorstrukturierung der Themen, die in den darauf folgenden 
Kapiteln beschrieben werden. 
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5 Sprachliche Daten, Untersuchungsmethoden, 
Präsentationsformen und Qualitätssicherung 


Die den „Bausteinen“ zugrunde liegenden Untersuchungen basieren vor allem 
auf dem Untersuchungskorpus des IDS-Projekts „Korpusgrammatik - gram- 
matische Variation im standardsprachlichen und standardnahen Deutsch“ 
Das Untersuchungskorpus umfasst zurzeit 23 Mio. Dokumente, 5,8 Mrd. Wör- 
ter sowie 7 Mrd. Tokens und stellt einen Ausschnitt des Deutschen Referenz- 
korpus (DeReKo, vgl. Kupietz et al. 2018), Release 2017-II, dar. Es enthält vor 
allem klassische Druckerzeugnisse und wurde im Rahmen des Projekts mit 
Dokumentmetadaten wie ‚Land‘, ‚Region‘, ‚Register‘, ‚Medium‘, ‚(inhaltliche) 
Domäne‘ und ‚Entstehungszeit‘ angereichert und stratifiziert (Bubenhofer et al. 
2014: 54-76). Seine aktuelle Zusammensetzung ist unter https://grammis.ids- 
mannheim.de/korpusgrammatik/6616 (abgerufen am 23.7.2020, DOI: 10.14618/ 
korpusgrammatik) beschrieben. Mitunter werden Teilkorpora des Untersu- 
chungskorpus gebildet, die in den einzelnen Bausteinen an einschlägigen Stellen 
spezifiziert werden. Um Internettexte besser in den Blick zu bekommen, werden 
ergänzend Teilkorpora des DECOW 16 (Schäfer & Bildhauer 2012; Schäfer 2015) 
benutzt. 

Das Untersuchungskorpus verfügt über zahlreiche Annotationsebenen. In 
dieser Ausgabe der „Bausteine“ wurden insbesondere Annotationen nach Lemma 
und Wortart (v.a. TreeTagger, vgl. Schmid 1994, und SMOR, vgl. Schmid et al. 
2004), morphologischen Merkmalen (MarMoT, vgl. Müller et al. 2014), Wortbil- 
dung (Canoo)'' sowie Eigennamen (Stanford NER, Finkel et al. 2005) verwendet 
(vgl. https://grammis.ids-mannheim.de/korpusgrammatik/6625, abgerufen am 
23.7.2020, DOI: 10.14618/korpusgrammatik). Für die einzelnen Untersuchungs- 
themen werden die sprachlichen Daten auch spezifisch nachannotiert, was an 
entsprechenden Stellen beschrieben wird. 

In den statistischen Analysen werden in dieser Ausgabe der „Bausteine“ 
verschiedene Maße und Verfahren benutzt, darunter Chi-Quadrat-Tests und 
Pearson-Residuen mit entsprechenden Visualisierungen, Baayens (2009: 902) 
potenzielle Produktivität als morphologisches Produktivitätsmaß, Modellierun- 
gen von Worthäufigkeitsverteilungen mithilfe des Softwarepakets zipfR (Evert & 
Baroni 2007) sowie binäre logistische Regressionen. Bei der statistischen Model- 
lierung und Visualisierung kommt insbesondere die freie Open-Source-Software 
R (R Core Team 2020) zum Einsatz. Neben den statistischen Analysen werden 
umfangreiche und vielschichtige qualitative Sichtungen der Daten vorgenom- 
men, die öfter auch explorative Vorstufen für quantitative Analysen bilden. Die 


11 Siehe  https://web.archive.org/web/20200326230620/http://canoonet.eu/ (abgerufen 
am 10.5.2020). 
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Kenndaten der Analysen sowie Hintergrunderläuterungen befinden sich an ein- 
schlägigen Stellen im Haupttext oder sind bei logistischen Regressionen in die 
Anhänge ausgelagert. 

Die Arbeit mit der korpuslinguistischen Methodik und die Notwendigkeit, 
die statistischen Methoden genau darzustellen, werden die Kapiteltypen in der 
Korpusgrammatik und damit die Präsentationsformen der „Bausteine“ beeinflus- 
sen. Wie in den meisten anderen Grammatiken sollen auch in der Korpusgram- 
matik größere Themenbereiche soweit möglich in der Abfolge vom Allgemeinen 
zum Besonderen behandelt werden. Dies wird sich in verschiedenen Typen von 
Kapiteln spiegeln. An einem Ende der Skala steht dann ein Überblickskapitel, 
in dem ein ganzer Phänomenbereich unter Verwendung korpuslinguistischer 
Perspektiven gesichtet wird und in dem auf interessante Variationsbereiche 
hingewiesen wird, am anderen Ende ein Kapitel, in dem ein spezielles Variati- 
onsphänomen eingehend analysiert wird. Ein solches Kapitel kommt schon einer 
Fallstudie nahe: Darin werden oft die Einflussgrößen des konkreten Variations- 
falls ermittelt, statistisch geprüft und in ihrer Effektstärke bestimmt. Zwischen 
diesen beiden Kapiteltypen stehen einerseits Überblickskapitel, die auf niedri- 
geren Abstraktionsstufen angesiedelt sind, und andererseits solche Kapitel, die 
die Variabilität der Grammatik auf abstrakteren Stufen untersuchen als der eines 
konkreten Variationsphänomens. Tendenziell werden in Überblickskapiteln 
mehr deskriptiv-statistische und explorative Methoden angewendet. Die infe- 
renzstatistischen Methoden nehmen zu, je näher das Kapitel an die Fallstudie 
herankommt. Hier wächst auch der Bedarf an Dokumentation der Methoden. In 
dieser Ausgabe der „Bausteine“ erscheinen zwei Überblickskapitel unterschied- 
lichen Abstraktionsgrades und zwei Kapitel, die einer Fallstudie nahekommen 
(vgl. Abschnitt 7 weiter unten). 

Mit den „Bausteinen“ wird eine Veröffentlichungsstrategie verfolgt, die den 
Mehrwert einer Online-Publikation ausnutzt, um die zugrunde liegenden Unter- 
suchungen im intendierten Sinne nachvollziehbar und damit anschlussfähig zu 
machen. Anders als es bei bisherigen Grammatiken des Deutschen der Fall ist, 
werden bei ausgewählten Themen die ausgewerteten Sprachdaten online veröf- 
fentlicht und mit den „Bausteine“-Texten verlinkt. Ergebnisse komplexerer kor- 
puslinguistisch-statistischer Analysen werden direkt in den Bausteinen doku- 
mentiert oder - bei größerem Umfang - ebenfalls online zugänglich gemacht. 
Mit der Wahl eines Open-Access-Formats sowie mit der Veröffentlichung von 
Datensätzen (Open Data) und Dokumentationen statistischer Analysen (Open 
Methodology) trägt die Reihe zur offenen Wissenschaft bei. 

Durch die geschilderten Maßnahmen wird die Entstehung der Korpusgram- 
matik weitgehend transparent gehalten, sodass den Autor/inn/en bei ihren 
grammatikografischen Bemühungen gewissermaßen zugesehen werden kann. 
So können auch die Reaktionen aus der Forschungsgemeinde auf das Vorhaben 
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Korpusgrammatik zurückwirken. Eine besondere Rolle im Entstehungsprozess 
der „Bausteine“ kommt dem Wissenschaftlichen Beirat zu. Er setzt sich aus 
namhaften Kolleg/inn/en zusammen, die über besondere Expertise in der Gram- 
matikografie des Deutschen einerseits und/oder in der Korpus- und Computer- 
linguistik andererseits verfügen und sich bereit erklärt haben, uns auf dem Weg 
zu einer Korpusgrammatik zu begleiten. 


6 Geplanter Aufbau der Korpusgrammatik 


Die Bausteine müssen modular in eine Makrostruktur einpassbar sein, die der 
anvisierten Gliederung der künftigen Korpusgrammatik entspricht. Geplant ist 
eine in ihren Grundzügen traditionelle Gliederung mit zwei Hauptteilen. Im ers- 
ten wird die Grammatik von den herkömmlichen grammatisch bestimmbaren 
Ausdrucksklassen her betrachtet, die unterhalb der Satzebene liegen, wie Wort, 
Substantiv oder Nominalphrase. Im zweiten Hauptteil bildet der Satz als Realisie- 
rung der kommunikativen Minimaleinheit den Ausgangspunkt, und es werden 
dort syntaktische Funktionen und Relationen untersucht, die typischerweise auf 
der Satzebene zu beobachten sind. Wenn man umschließende Gliederungsein- 
heiten wie Vorwort, eine allgemeine Einführung, ein einleitendes Kapitel zur 
korpuslinguistischen Basis und Methodik, ein Literaturverzeichnis und mögliche 
Register erst einmal beiseitelässt, sieht die Gliederung für den ersten Hauptteil 
der Korpusgrammatik folgende Großkapitel vor: 

Wortbildung 

Wörter und Wortgruppen 


m 


Substantiv, Nomen und Nominalphrase 

Adjektiv und Adjektivphrase 

Adverb und Adverbphrase 

Andere nicht flektierbare Wortarten 

Verb, Verbalkomplex, Verbgruppe (Verbalphrase) 


TOOR N 


Der erste Hauptteil ist somit als eine „Wort- und Phrasengrammatik“ konzi- 
piert (zu einer in Grundzügen ähnlichen Anlage vgl. z.B. die korpusgestützte 
Grammatik des Englischen von Biber et al. 2006 [1999]: v.a. 44). Im Hinblick 
auf die grammatisch bestimmten Ausdruckseinheiten folgt der Aufbau im Kern 
einer aszendenten Betrachtungsweise, die die Reihenfolge Morphologie - Syn- 
tax vorgibt. Dabei wird zuerst in einem getrennten Großkapitel die Wortbildung 
behandelt. In jedem der darauf folgenden Großkapitel zu flektierbaren Wörtern 
und darauf basierenden Wortgruppen sollen dann die Bereiche Flexion und Syn- 
tax nach einer einführenden Übersicht über Flexionskategorien und ihre Rea- 
lisierungsformen zu einer Morphosyntax zusammenfließen, sobald es um die 


6 Geplanter Aufbau der Korpusgrammatik — 19 


Betrachtung konkreterer Variationsfälle geht. Damit steht im ersten Hauptteil 
eine eher an formalen Aspekten orientierte Perspektive im Vordergrund. 

Die Gliederung des zweiten Hauptteils soll durch Themen wie die folgenden 
bestimmt sein: 


m 


Kommunikative Minimaleinheit, Satz, Satzkomponenten 


2. Komplementation 

3. Supplementation 

4. Kongruenz und Rektion 
5. Wortstellung 

6. Informationsstruktur 

7: 


Komplexere Strukturen (Asyndese, Syndese, Koordination, Subordination, 
komplexe Sätze) 


Zunächst wird mit dem Satz als einer auf dem finiten Verb basierenden, proto- 
typischen Realisierung der kommunikativen Minimaleinheit (dazu Zifonun 
1997a: 86; 1997b: 608) die zentrale Bezugsgröße der Beschreibung etabliert. 
Man kann somit beim zweiten Hauptteil tendenziell von einer „Satzgramma- 
tik“ sprechen. Allerdings werden darin im Weiteren syntaktische Funktionen 
und Relationen thematisiert, die zwar typischerweise, aber nicht nur in Sät- 
zen eine Rolle spielen. Der Aufbau ist bis in die Großkapitel Komplementation 
und Supplementation hinein deszendent. In diesen beiden Großkapiteln rückt 
dann langsam die funktionale Perspektive als Ordnungsprinzip in den Vorder- 
grund, denn syntaktische Funktionen werden nicht nur für die Satzebene postu- 
liert, sondern auch für Ausdruckseinheiten, die unterhalb der Satzebene liegen 
(vgl. z.B. Verbkomplemente einerseits und Komplemente in der Nominal- oder 
Adjektivphrase andererseits). So sind auch die Relationen der Kongruenz und 
der Rektion für Ausdruckeinheiten unterschiedlichen Ranges relevant.'” Die 
folgenden, ebenfalls relational bzw. funktional interpretierbaren Themen wer- 
den (wie „Wortstellung“ und „Informationsstruktur“) üblicherweise im Kontext 
von Sätzen behandelt oder betreffen (wie „Komplexere Strukturen“) ein Spekt- 
rum von Ausdruckseinheiten, die die Satzebene sowohl deutlich unter- als auch 
überschreiten können. Der Schwerpunkt im zweiten Hauptteil liegt somit ins- 
gesamt auf dem Vergleich der verschiedenen Realisierungsformen für syntakti- 
sche Funktionen und Relationen, die unterschiedlichen grammatischen Ebenen 
angehören können. 


12 Zur Kongruenz vgl. z.B. die Numeruskongruenz zwischen Subjekt und finitem Verb 
auf der Satzebene und die Numerus- und Kasuskongruenz zwischen Determinierer 
und Nomen in einer Nominalphrase, zur Rektion etwa die Rektion der Verbkomple- 
mente durch das Verb auf der Satzebene oder die Rektion des Kasus einer Nominal- 
phrase durch die Präposition in einer Präpositionalphrase. 
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Die vorgestellte Gliederung ist tentativ. Sie ist modifizierbar und vor allem 
in Bezug auf den zweiten Hauptteil ergänzbar. Die Formulierungen der Kapitel- 
überschriften sind vorläufig. Die Gliederung muss einigermaßen flexibel sein, 
damit die Autor/inn/en mit Änderungen und Erweiterungen auf sich eventuell 
durch die Forschungsdynamik ergebende Entwicklungen reagieren können, die 
in ihrer Arbeit an der Korpusgrammatik oder in der aktuellen Forschung im All- 
gemeinen entstehen. 

Die Zweiteilung der Korpusgrammatik spiegelt die Doppelperspektivik, 
nach der sich die Darstellung richten soll: Zum einen wird bei der Grammatik- 
beschreibung von formbezogen bestimmten Einheiten ausgegangen (so tendenzi- 
ell im ersten Hauptteil), zum anderen von funktional bestimmten Einheiten bzw. 
bestimmten Funktionen (so tendenziell im zweiten Hauptteil). Die eine Perspek- 
tive involviert, dass formbezogene Einheiten in Bezug auf ihre verschiedenen 
Funktionen untersucht werden, d.h. eine Art semasiologische Vorgehensweise 
verfolgt wird, die andere Perspektive, dass für bestimmte Funktionen verschie- 
dene Realisierungsformen ermittelt werden, d.h. quasi onomasiologisch vorge- 
gangen wird.'” Diese Doppelperspektivik bekommt unter dem Aspekt der Varia- 
tion einen besonderen Sinn: Beide Male wird nach Varianten geforscht, nur sind 
diese in ersterem Fall funktional und in letzterem Fall formal ausdifferenziert (vgl. 
Fuß et al. 2017: 229-233). Interessanterweise hat sich in der modernen Linguistik 
unter dem Begriff Variation nur die zweite Perspektive richtig etablieren kön- 
nen, wozu entscheidend die soziolinguistischen Arbeiten Labovs (1960: 15-17) 
zur „linguistischen Variante“ beigetragen haben. Wir allerdings wollen auf das 
innovative Potenzial einer systematischen „reziproken“ Variationsbetrachtung 
setzen und den bewussten Perspektivenwechsel zum festen Bestandteil unserer 
grammatikografischen Herangehensweise machen. Die beiden Perspektiven las- 
sen sich auf der Ebene der Hauptteile und der Großkapitel bis zu einem gewissen 
Grad auseinanderhalten. In kleineren Gliederungseinheiten soll demgegenüber 
ein zyklischer Perspektivenwechsel es möglich machen, in der grammatischen 
Erkenntnis immer weiter vorzudringen (dazu Fuß et al. 2017: 235). 


7 Bausteine dieser Ausgabe 


Geplant sind jährlich bis zu zwei Ausgaben der „Bausteine“ in einer Online- 
und einer Print-on-Demand-Version. Nur diese vorliegende Ausgabe enthält 
eine längere Einleitung - sie führt in die gesamte Reihe ein. Die Bausteine der 


13 Zur Übertragung der semasiologischen und onomasiologischen Perspektive auf die 
Betrachtung der Variation vgl. Ammon (2005: 30) und schon von der Gabelentz (1995 
[1901]: 84—86). 
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vorliegenden Ausgabe sind als Kapitel verschiedener Hierarchieebenen aus den 
Großkapiteln „Wortbildung“ und „Substantiv, Nomen und Nominalphrase“ ange- 
legt. Wie sie sich in die bisher geplante Struktur der Großkapitel einfügen, zei- 
gen die folgenden Übersichten. Auf der oberen, nummerierten Ebene erscheinen 
die Titel aller bisher vorgesehenen Kapitel dieser Ebene. Auf der unteren, nicht 
nummerierten Ebene hingegen sind nur diejenigen Kapitel aufgeführt, die als 
Bausteine publiziert sind. Die Titel aller vier Kapitel, die den Bausteinen dieser 
Ausgabe entsprechen, sind hervorgehoben: 


Wortbildung 
1. Grundlegende Aspekte der Wortbildung 
2. Wortbildungsarten 
3. Spezialbereiche der Wortbildung 
- Bau von und Umbau zu Adverbien: Präpositionen, Vergleiche 
und Flexion 


Substantiv, Nomen und Nominalphrase 
1. Flexion des Nomens 
2. Aufbau der Nominalphrase 
3. Determination und Quantifikation 
4. Attribution 
- Starke vs. schwache Flexion aufeinanderfolgender attributiver 
Adjektive: mit hohem technischen/technischem Aufwand 
- Reihenfolge attributiver Adjektive 
5. Syntaktische Funktionen von Nominalphrasen 


Der Baustein Grundlegende Aspekte der Wortbildung eröffnet das Kapi- 
tel Wortbildung. Er besitzt dementsprechend einen expositorischen Charakter 
und ist als Überblickskapitel angelegt. Er zeigt grundlegende Mechanismen der 
Wortbildung im Deutschen, erkundet vor allem deskriptiv-statistisch Relationen 
(u.a. die Produktivitätsverhältnisse betreffend) zwischen Wortbildungen und 
primären Wörtern und präsentiert allgemeine Wortbildungsprofile der Haupt- 
wortarten. Der Baustein Bau von und Umbau zu Adverbien: Präpositionen, 
Vergleiche und Flexion ist als Überblickskapitel einer etwas tieferen Ebene 
angelegt. Er behandelt ein für die empirische wie auch die theoretische For- 
schung besonders herausforderndes Thema. Die Wortbildung des Adverbs ist 
nicht allzu häufig Forschungsgegenstand und ist daher besonders geeignet, in 
die „Spezialbereiche der Wortbildung“ aufgenommen zu werden. Der Baustein 
gibt einen deskriptiv-statistisch fundierten Überblick über die Bildungsmuster 
des komplexen Adverbs. Besonders fokussiert werden Adverbien, die mit For- 
mativen enden, die in der Flexion vorkommen, und solche mit präpositionalen 
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Bestandteilen (vgl. für beide Adverbklassen z.B. zunächst). Auf quantitativen 
und qualitativen Korpusauswertungen bauen theoretische Überlegungen auf, 
die grundlegende Bedingungen für die Entstehung komplexer Adverbien zum 
Gegenstand haben und Prozesse aufdecken, die komplexe Adverbien mit Prä- 
positionalphrasen korrelieren. Mit Starke vs. schwache Flexion aufeinan- 
derfolgender attributiver Adjektive: mit hohem technischen/ technischem 
Aufwand wird ein Baustein aus dem Bereich Nominalphrase vorgelegt. Darin 
wird ein konkreter Variationsfall behandelt, der es auch zu einem notorischen 
Zweifelsfall des Sprachgebrauchs gebracht hat. Mithilfe logistischer Regressi- 
onen wird nach Einflussgrößen für die Wahl zwischen starker und schwacher 
Flexion des zweiten Adjektivs gesucht. Berücksichtigt werden sprachsystemati- 
sche Bedingungen wie die Möglichkeit einer Koordination der beiden Adjektive 
sowie extralinguistische Einflüsse wie das Herkunftsland des Belegs. Im Anhang 
erscheint die Dokumentation der statistischen Modellierung, die die Analysen 
nachvollziehbar macht, aber aus dem Haupttext ausgelagert werden musste, um 
ihn besser lesbar zu machen. Ein Teil der Sprachdaten, die der Untersuchung 
zugrunde liegen, ist - angereichert um die untersuchungsrelevanten Annotati- 
onen - online veröffentlicht (vgl. Abschnitt 8 unten). Die Sprachdaten wurden 
im Rahmen dieser Untersuchung bereits so weit aufbereitet, dass sich auch der 
nächste Baustein Reihenfolge attributiver Adjektive darauf stützen konnte. 
In diesem Baustein wird geprüft, wie bei Abfolgen aus zwei Adjektiven wie in 
mit begeistertem, minutenlangem Beifall die Reihenfolge gesteuert wird. Es zeigt 
sich, dass dabei semantische Aspekte mit anderen Einflussgrößen interagieren 
wie etwa der Silbenanzahl oder der Häufigkeit der involvierten Adjektive. Die 
eingesetzte Regressionsanalyse wird auch bei diesem Baustein in einem Anhang 
genauer beschrieben. 

Die Beiträge der Reihe „Bausteine einer Korpusgrammatik des Deutschen“ 
werden weitgehend wie Kapitel einer korpusgestützten, variationssensitiven 
Grammatik gestaltet, aber dennoch nicht ganz so, wie sie in einem bereits fer- 
tiggestellten Werk erscheinen würden. Vor allem bei dieser ersten Ausgabe 
muss vieles an Ort und Stelle erklärt werden, was ansonsten in ein anderes 
Kapitel hätte ausgelagert werden können. Dies betrifft in besonderer Weise 
Ausführungen zur Methodik, deren Explizitmachung uns so wichtig erscheint. 
Ein Teil dieser Ausführungen wird sich in einem Kapitel zur korpuslinguis- 
tischen Basis und Methodik der ganzen Korpusgrammatik wiederfinden, da 
einige methodische Aspekte konstant bleiben und einige Verfahren immer wie- 
der angewendet werden. Jetzt schon einen Baustein zu schreiben, der einem 
solchen Kapitel entspricht, ist jedoch verfrüht, da sich das Spektrum der einge- 
setzten Methoden mit weiteren Themen der Korpusgrammatik und damit ein- 
hergehenden neuen Problemstellungen um einiges erweitern wird. Dadurch, 
dass die Korpusgrammatik mit der Publikation der „Bausteine“ portionsweise 
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entsteht, sind also gewisse Redundanzen vorprogrammiert. Die Leser/innen 
mögen durch die Aktualität der präsentierten Forschungsergebnisse, die rela- 
tive Eigenständigkeit einzelner Bausteine und die Möglichkeit, das Entstehen 
der Korpusgrammatik mit frühzeitigen Reaktionen zu begleiten, entschädigt 
sein. 

Die einzelnen Bausteine haben verschiedene Autor/inn/en, die sich auf ein 
gemeinsames inhaltliches Programm und die wichtigsten Aspekte der forma- 
len Gestaltung geeinigt haben. Auf eine stilistische Vereinheitlichung der Texte 
wurde bewusst verzichtet. Wir hoffen, dass Stilunterschiede die Leser/innen von 
den Inhalten nicht ablenken werden. 


8 Veröffentlichte Forschungsdaten zu dieser Ausgabe und 
Verlinkung mit Internetquellen 


Die Bausteine Starke vs. schwache Flexion aufeinanderfolgender attribu- 
tiver Adjektive: mit hohem technischen/technischem Aufwand und Rei- 
henfolge attributiver Adjektive basieren in wichtigen Teilen auf dem aufbe- 
reiteten Datensatz ATTRIBUTIVE_ADJEKTIVE_1. Dieser ist die Grundlage für die 
„Datenbank attributive Adjektive“, die unter der folgenden Adresse öffentlich 
zugänglich ist: 


https://grammis.ids-mannheim.de/attributiveadjektivedb 
(abgerufen am 11.7.2020) 
DOI: 10.14618/attributiveAdjektiveDB 


Die Datenbank besteht aus 1.598 Belegen zu artikellosen Nominalphrasen mit 
je zwei attributiven Adjektiven im Dativ Singular Maskulinum oder Neutrum, 
angereichert durch zahlreiche Annotationen. Die komplette Datensammlung 
kann auch heruntergeladen und für eigene Anschlussuntersuchungen verwen- 
det werden. 

In den in einem Open-Access-Format erscheinenden „Bausteinen“ soll der 
Leserschaft nach Möglichkeit der direkte Zugang zu allen zitierten Internet- 
quellen ermöglicht werden. Alle Internetadressen sind mit einem Abrufdatum 
versehen und in den online erscheinenden Texten als Links aktiv. Sofern den 
Quellen ein Permalink oder ein DOI zugeordnet sind, bemühen wir uns, diese 
anzugeben. Zusätzlich werden alle zitierten Internetseiten in Internet Archive'* 
gespeichert. Dort sollten alle Versionen mit dem angegebenen Abrufdatum ein- 
sehbar sein. 


14 Vgl. https://web.archive.org/, abgerufen am 27.7.2020. 
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Grundlegende Aspekte der Wortbildung 


Abstract This chapter begins with a sketch of the specifics of our approach, an 
overview of the contents of the chapters on word formation and some method- 
ological notes. It then discusses the general characteristics of word formations 
and of their overall inventory, comparing word formations to primary words. 
Furthermore, the chapter explores the relative frequencies of word formations 
in different vocabulary areas and traces the word formation profiles of individual 
parts of speech. Finally, it compiles the characteristic word formation rules for 
different parts of speech. 


Keywords word formation, simple word, complex word, productivity, part of 
speech, word formation types 


1 Fragestellung und Methodisches 


Die deskriptiv-grammatische Perspektive auf die Wortbildung’ verlangt es, dass 
wir uns auf die Darstellung von Regularitäten konzentrieren und nicht auf die 
Behandlung von Idiosynkrasien. Dazu gehört es, dass ins Zentrum der Beschrei- 
bung Klassen von Wörtern gerückt werden, die auf relativ hohen Abstraktions- 
ebenen definiert sind, und nicht etwa Bildungen auf der Basis eines bestimmten 
Lexems oder einiger weniger Lexeme eines bestimmten Wortfeldes. In diesem 
Sinne nehmen wir eine regelorientierte und nicht eine lexemorientierte Perspek- 
tive ein. Dennoch bleiben bei Kategorisierungen - etwa in primäre Wörter und 
Wortbildungen - lexembasierte Entscheidungen nicht aus. Die beiden Perspek- 
tiven sind damit nicht strikt getrennt. Allerdings wird die lexemorientierte Sicht 
nur so weit verfolgt, wie es für die regelorientierte Beschreibung notwendig ist. 

Bei unserer Beschreibung von Wortbildungen können verschiedene Abs- 
traktionsebenen unterschieden werden. Auf der obersten Ebene werden 


1 Zum Wesen der Wortbildung als Gegenstand der Grammatik vgl. z.B. Fleischer & 
Barz (2012: 1-3), Eisenberg (2013: 201-208), Dudengrammatik (2016: 645-649). 
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Wortbildungen? nicht weiter analysiert, sondern als Gesamtgruppe den übrigen 


(nicht „wortgebildeten“) Wörtern gegenübergestellt. Die weiteren wichtigen 


Beschreibungsebenen sind — mit absteigendem Abstraktionsgrad: 


die Ebene der Wortbildungsarten, auf der wortartenübergreifende Bauwei- 
sen unterschieden werden können wie Komposition, Derivation oder Kon- 
version (vgl. z.B. Fleischer & Barz 2012: 83-90), 

die Ebene der Wortbildungsregeln, auf der die Wortbildungsprodukte und 
ihre Bausteine kategorial spezifiziert werden, oft in Bezug auf Wortart oder 
Affixkategorie wie in den schematischen Darstellungen SBST + SBST — 
SBST? (z.B. Umsatz |steuer) oder ADJ + SUFF — SBST (z.B. Aufmerksam|keit), 
die Ebene der Wortbildungsmuster, auf der die Wortbildungsproduk- 
te teils kategorial, teils formal spezifiziert bzw. als individuelle Ausdrücke 
angegeben werden wie in der Formulierung „Adverbbildungen auf -weise“ 
(behelfs|weise, haufen | weise etc.) oder in der entsprechenden schematischen 
Darstellung SBST + weise — ADV. 


Unsere empirische Exploration von Wortbildungsphänomenen orientiert sich 


vor allem an folgenden Fragen: 


1. 


Welche grundlegenden Regularitäten sind in der Wortbildung des Gegen- 
wartsdeutschen zu beobachten? 

Wie verteilen sie sich auf verschiedene Klassen von Wörtern? 

Welche Wortbildungsarten und Wortbildungsregeln sind in den behandelten 
Klassen von Wörtern besonders frequent? 

Welche Wortbildungsmuster sind besonders produktiv und wie ist dies zu 
erklären? 

Welche sprachlichen und außersprachlichen Variablen beeinflussen die Rea- 
lisierung produktiver Wortbildungsmuster? 

Welche Regeln stehen hinter den relevanten Wortbildungsmustern, welchen 
Wortbildungsarten entsprechen die Regeln? 


Die Beschreibung betrifft dabei ausdrücklich nur das Gegenwartsdeutsche. 


Jedoch macht die Erklärung von Regularitäten im Aufbau von Ausdrücken, die 


als Wortbildungen kategorisiert werden, gelegentlich auch kurze Exkurse in die 


Sprachgeschichte notwendig. 


Wortbildung wird hier also nicht nur für die verschiedenen Aspekte des Wortaufbaus 
und für die linguistische Disziplin gebraucht, sondern auch für ein Wort, das infolge 
von Wortbildungsprozessen entstanden ist. Letzteres wird zuweilen verdeutlichend 
als Wortbildungsprodukt bezeichnet. 

SBST = Substantiv, ADJ = Adjektiv, ADV = Adverb, SUFF = Suffix. 
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Eine ausführliche Behandlung aller Bereiche der deutschen Wortbildung ist in 
dieser Grammatik nicht möglich. Wir beschränken uns auf einen empirisch fun- 
dierten Gesamtüberblick in den Kapiteln „Grundlegende Aspekte der Wortbildung“ 
und „Wortbildungsarten“ und widmen uns im Anschluss vertiefenden und auf 
besondere Detailschärfe abzielenden Beschreibungen ausgewählter Spezialbereiche. 

Im vorliegenden Kapitel werden die allgemeinen Charakteristika der einschlä- 
gigen Wortbildungen und ihres Gesamtinventars vorgestellt, die relativen Häu- 
figkeiten von Wortbildungen in verschiedenen Wortschatzbereichen erörtert, die 
Wortbildungsprofile einzelner Wortarten nachgezeichnet und die für einzelne 
Wortarten charakteristischen Wortbildungsregeln genannt (Fragen ı bis 3 oben). 
Das darauffolgende Kapitel ,Wortbildungsarten® liefert eine formal-kompositio- 
nale Beschreibung der Wortbildungsarten, ergänzt um die Ermittlung wortarten- 
übergreifender Regularitäten und um die Erörterung von Prinzipien der seman- 
tisch-relationalen Interpretation komplexer Wörter (Fragen 3 bis 4). Die weiteren 
Kapitel behandeln einerseits besonders Variationsträchtiges, andererseits wenig 
Untersuchtes und schwer Klassifizierbares (Fragen 4 bis 6). So wird im Kapitel 
„Substantivkomposition und Fugenelemente“ ein Phänomenbereich aufbereitet, 
der besonders stark durch ein Nebeneinander verschiedener formaler Möglich- 
keiten gekennzeichnet ist. In den Kapiteln „Bau von und Umbau zu Adverbien“ 
und „Desubstantivische Zweitglieder in der Wortbildung des Adverbs“ werden 
wiederum Wortbildungsregeln und -muster behandelt, die sich mit den Wortbil- 
dungsarten wie Komposition, Derivation und Konversion in ihrem klassischen 
Verständnis nur schwer in Einklang bringen lassen. Im Kapitel „Partikel- und 
Präfixverben und ihre Komplemente“ schließlich werden Wortbildungsphäno- 
mene beschrieben, deren Auswirkungen weit in die Syntax hineinreichen. 

In methodischer Hinsicht haben die Ausführungen ihren Ausgangspunkt in 
Betrachtungen quantitativer Verhältnisse zwischen Klassen unterschiedlich gebil- 
deter Wörter. Besonders wenn sich diese Betrachtungen auf das gesamte Untersu- 
chungskorpus (ca. 7 Mrd. Tokens, davon knapp 6 Mrd. Worttokens) beziehen, ist 
mit einer gewissen Unschärfe zu rechnen. Mit einer derart großen Datenmenge 
kann man nämlich nur dann effektiv arbeiten, wenn Ergebnisse automatischer 
Annotationen genutzt werden. Die Güte solcher Annotationen lässt sich in einem 
großen Korpus allerdings nur stichprobenartig überprüfen. Korrekturen können 


4 Für umfassende Darstellungen des Gegenwartsdeutschen vgl. u.a. Deutsche Wortbil- 
dung (1973-1992, Bd. 1-5), Motsch (1999), Eichinger (2000), Donalies (2002), Fleischer 
& Barz (2012), nicht unerwähnt bleiben soll hier auch die online verfügbare, lexi- 
kographische Quelle elexiko (https://www.owid.de/docs/elex/start.jsp, abgerufen am 
18.6.2020, vgl. Haß & Klosa 2015). Als wichtige ältere Werke sind vor allem Grimm 
(1826), Wilmanns (1899), Paul (1920) und Henzen (1965) zu nennen. 

5 In dieser Ausgabe der „Bausteine einer Korpusgrammatik des Deutschen“ nicht mehr 
enthalten. 
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oft nur punktuell vorgenommen werden, sodass meist ein Recall- und evtl. auch 

ein Präzisionsverlust in Kauf genommen werden muss. Das Gesamtkorpus wird 

daher vor allem zur Exploration der Phänomenvielfalt und für globale Hypothe- 

sen zur Reichweite und Produktivität von Wortbildungsregeln genutzt. Bei spezi- 

elleren Fragestellungen werden öfter Teilkorpora herangezogen, und zwar 

- das Korpus 4ok, in dem 40.000 zufällig ausgewählte Sätze aus dem Gesamt- 
korpus zusammengestellt wurden (750.643 Tokens) und 

- die zufällig zusammengestellten Achtel des Gesamtkorpus (Korpora 8th-1 bis 
8th-8, je über 877 Mio. Tokens). 


Manche komplexen Korpusrecherchen sind erst durch die Benutzung dieser Teil- 
korpora in einer vertretbaren Zeit durchführbar. Ihre Verwendung macht es mög- 
lich, die Qualität der Recherchen zu steigern, da die Ergebnisse automatischer 
Suchen auf Umfänge reduziert werden, bei denen sie genauer überprüft und im 
Bedarfsfall korrigiert bzw. durch Nachrecherchen ergänzt werden können. Im 
Folgenden machen wir im Allgemeinen Gebrauch von der TreeTagger‘-basierten 
Lemmatisierung, einer Wortbildungsannotation, die auf den Wortbildungsanaly- 
sen von Canoo’ aufbaut, und den Wortarten-Annotationen von TreeTagger und 
Canoo. Da sich unsere Darstellung der substantivischen Wortbildungen auf die 
den Kern dieses Bereichs bildenden Appellative beschränkt, wird außerdem bei 
den Recherchen grundsätzlich mithilfe von Stanford NER (Finkel et al. 2005) eine 
Einschränkung auf Nicht-Eigennamen vorgenommen. 

Im Teilkorpus 4ok, das im vorliegenden Kapitel eine besondere Rolle spielt, 
finden sich der Canoo-Klassifizierung zufolge 623.130 Wörter. Nach Ausschluss 
von Eigennamen, von Wörtern, deren Wortart nicht erkannt wurde oder die 
falsch bzw. gar nicht lemmatisiert wurden, sowie nach manuellen Korrekturen’ 
werden 558.374 Tokens berücksichtigt, die sich auf 48.901 TreeTagger-Lemmata 
verteilen. Bei diesen Daten wurde die Wortbildungsannotation an neuralgischen 
Stellen überprüft. Vor allem wurden alle Lemmata in Augenschein genommen, 
die Canoo nicht als Wortbildungen analysierte. Handelte es sich bei einem 
Lemma doch zweifelsfrei um eine synchron analysierbare Wortbildung, wurde 
es manuell als solche annotiert.” 


6 Vgl. Schmid (1995) - unterstützend wurden ein Lexikon (https://github.com/rsling/ 
cow/blob/master/src/de/data/lexicon, abgerufen am 7.6.2020) aus dem COW-Web- 
korpusprojekt (Schäfer & Bildhauer 2012, Schäfer 2015) und ein mithilfe von SMOR 
(Schmid et al. 2004) generiertes Ad-hoc-Lexikon verwendet. 

7 Siehe http://canoonet.eu/services/WordformationRules/ueberblick/index.html?lang=de 
(abgerufen am 6.12.2019). 

8 Manuell wurden weitere Eigennamen ausgeschlossen und Kardinalzahlwörter anno- 
tiert, die in der Wortartenklassifizierung von Canoo nicht erfasst wurden. 

9 Solche Lemmata waren z.B. Orkanbö, abrechenbar, gestreng, beproben, derweil, sowas. 
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Bei der Bestimmung des Gegenstands der linguistischen Disziplin Wortbildung 
ist eine Abgrenzung der zu fokussierenden Bildungen von sonstigen Wörtern 
gefragt. Hilfreich ist hier eine Unterscheidung von primären und sekundären 
Wörtern (vgl. Dudengrammatik 2016: 645, Meibauer et al. 2007: 33-34). Erstere 
sind nicht auf andere sprachliche Einheiten zurückzuführen, letztere hingegen 
bauen auf anderen sprachlichen Einheiten auf und sind damit Wortbildungen. 
Diese Unterscheidung ist in der Praxis manchmal schwer anzuwenden, weil 
ältere Wortbildungen nicht immer als solche erkannt werden. Das Wort heute 
etwa wird von Fachleuten auf die althochdeutsche Phrase hiu tagu ‚an diesem 
Tag‘ zurückgeführt (vgl. z.B. DWB: Lemma „heute“). Für „normale“ Sprach- 
benutzer/innen ist die Wortbildungsvergangenheit von heute aber nicht mehr 
zu erkennen. Verdunkelte Wortbildungen sind auch Adler, Welt, erst, nein*® und 
viele andere Ausdrücke, die auf den ersten Blick wie primäre Wörter aussehen. 
Überhaupt schrumpft die Gruppe der Kandidaten für den Status eines primären 
Wortes immer weiter, je genauer man den Ursprung der Wörter erforscht. 
Solche alten, kaum oder gar nicht mehr als analysierbar erkennbaren Bil- 
dungen stehen jedoch nicht im Fokus von Beschreibungen der gegenwarts- 
sprachlichen Wortbildung. In diesen wird vielmehr eine „synchrone Erklärung 
des gegenwärtigen Wortbildungssystems“ (Fleischer & Barz 2012: 4) angestrebt. 
Das kann man so verstehen, dass in den zu behandelnden Ausdrücken Bausteine 
erkennbar sein sollen, die heute (das meint synchron in diesem Fall) interpre- 
tierbar sind und gleichzeitig nach heute nachvollziehbaren Regeln verbaut wer- 
den. Mit einer derartigen Vorgabe neigt man dazu, diejenigen Wortbildungen 
behandeln zu wollen, die von unseren Zeitgenoss/inn/en als solche empfun- 
den werden. Das kann aber zu keiner klaren Konturierung des Beschreibungs- 
gegenstands führen. Das Wortbildungswissen und die wortbildungsanalytischen 
Fähigkeiten Einzelner sind nämlich sehr unterschiedlich, und gleichzeitig ist es 
unklar, welche Sprachbenutzer/innen die Referenzgruppe bilden sollen: Manche 
erkennen schon in heute eine Wortbildung, einige mehr, jedoch bei Weitem nicht 
alle, werden in Fall, Wurf, statt und während" eine Wortbildung sehen, ein brei- 
ter Konsens, dass es sich um Wortbildungen handelt, wird sich jedoch womög- 
lich nur in Bezug auf eine zu sehr eingeschränkte Gruppe besonders transpa- 
renter Bildungen einstellen, die aus mehreren Konstituenten bestehen, welche 
entweder Wörtern gleichen (z.B. Haus|tiir, Schnell|zug, honig|gelb, klein |kariert, 


10 Vgl. Nübling et al. (2017: 185) und entsprechende Einträge in Pfeifer (1993). 
11 Entstanden wohl durch Umdeutung syntaktischer Verhältnisse: während der Zeit < 
(in) währender Zeit (vgl. Lemma „während“ in Pfeifer 1993 und DWB). 
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nach|dem, so| mit) oder häufige Wortbildungsmorpheme darstellen (z.B. Zeit|ung, 
verarbeiten, Ge|red|e). 

Indessen könnte postuliert werden, einschlägig seien bei der Zielsetzung 
„synchrone Erklärbarkeit“ diejenigen Wortbildungen, die sich sinnvoll und voll- 
ständig in solche sprachlichen Einheiten (Wörter, Morpheme, Fugenelemente 
u.ä.) analysieren lassen, die heute regulär verwendet werden. Eine korpus- 
orientierte Ideallösung würde dann nicht auf das individuell variierende Spra- 
chempfinden setzen, sondern versuchen, die Korpusdaten sprechen zu lassen. 
Ein Kriterium für eine sichere Klassifizierung einer Wortbildung als einschlägig 
wäre etwa der Befund, dass sich jeder ihrer Bausteine in der gleichen Bedeutung 
bzw. Funktion frei oder innerhalb von anderen Lexemen im Korpus wiederfindet. 
Einen entsprechenden intelligenten Abgleich von Korpuswörtern automatisch 
vorzubereiten und durchzuführen erscheint für unsere Zwecke aber als zu auf- 
wendig, und „manuell“ ist er für größere Datenmengen nicht durchführbar. 

Übrigens wären bei dieser Lösung Wortbildungen mit unikalen lexikalischen 
Morphemen ausgeschlossen worden. Betroffen hätte dies bekannte Fälle wie 
Brom|beere, Lind|wurm oder Un|flat, aber auch viele weniger bekannte Fälle wie 
Mein|eid, gewieft, reüss|ieren. Unikale Morpheme treten in genau einer Verbin- 
dung auf” und sind in diesem Sinne unproduktiv. Da ihre Bedeutung verblasst 
ist, können alle oben genannten Fälle als synchron nicht vollständig erklärbar 
betrachtet werden. Aber eigentlich sollte die Bestimmung der einschlägigen 
Wortbildungen im Sinne unserer regelorientierten Perspektive dazu dienen, das- 
jenige sprachliche Material zu sichern, in dem heute wirksame Regularitäten 
bzw. erkennbare Wortbildungsregeln zu finden sind, und die genannten Wörter 
mit unikalen Morphemen scheinen gerade nach solchen Regeln aufgebaut zu 
sein. Eine Lösung, die sie daher doch mit einbezieht, würde allerdings nicht mehr 
auf eine synchrone Erklärbarkeit der Bildungen abzielen, sondern nur auf ihre 
synchrone Analysierbarkeit. Bei dieser neuen Lösung wäre es für die Einschlä- 
gigkeit einer mehrgliedrigen Wortbildung unter Umständen ausreichend, wenn 
nur eine ihrer unmittelbaren Konstituenten heute regulär” vorkäme. Allerdings 
lässt sich auch diese Lösung korpuslinguistisch nicht direkt umsetzen. 

Vor dem Hintergrund solcher theoretischen Optionen muss nach einem 
pragmatischen Ausweg gesucht werden. Dabei wollen wir die zuletzt genannte 
Lösung nicht gänzlich aus den Augen verlieren: Wir möchten die Regularitäten 


12 Evtl. auch in den auf dieser Verbindung aufbauenden Wortbildungen (z.B. Brom- 
beer|saft). 

13 Also nicht nur im vorliegenden Wort und in den darauf aufbauenden Wortbildungen. 
So erscheint das Morphem {beere} nicht nur in Verbindung mit dem unikalen Mor- 
phem {brom-} in Brombeere oder Brombeersaft, sondern auch frei in Beere sowie in 
Blaubeere, Stachelbeere etc. Entsprechend ist Brombeere eine einschlägige Wortbildung. 
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in den heute synchron analysierbaren Wortbildungen beschreiben. In der Praxis 
greifen wir dann, um die großen Datenmengen zu bewältigen, auf die Canoo- 
basierte Annotation zurück. Diese verwendet vorzugsweise gelistete Wortbil- 
dungsanalysen und leitet ggf. nicht gelistete Bildungen mithilfe von Regeln ab. 
Die automatische Annotation wird, wann immer möglich und notwendig, durch 
manuelle Korrekturen präzisiert bzw. — sofern Recall-Prüfungen dies nahele- 
gen - durch zusätzliche, etwa formorientierte Recherchen ergänzt. Angemerkt 
werden muss dabei, dass die manuelle Analyse bzw. Annotation in einigen Fällen 
Interpretationsspielraum zulässt (etwa bezüglich der Zugehörigkeit verschiede- 
ner Formen zu ein und demselben Morphem). Dennoch glauben wir uns insge- 
samt der auf synchrone Analysierbarkeit der Bildungen ausgerichteten Ideal- 
lösung anzunähern. Gemäß dieser sind von den in diesem Abschnitt genannten 
Beispielen die Wörter Fall, Wurf, statt, während, Haustür, Schnellzug, honiggelb, 
kleinkariert, nachdem, somit, Zeitung, verarbeiten, Gerede, Brombeere, Lindwurm, 
Unflat, drollig, Meineid, gewieft, reüssieren als einschlägige Wortbildungen einzu- 
stufen, heute, Adler, Welt, erst, nein dagegen nicht. 


3 Primäre Wörter und Wortbildungen - 
Simplizia und komplexe Wörter 


Die einschlägigen Wortbildungen im Sinne von Abschnitt 2 werden im Weite- 
ren der Kürze wegen schlicht als „Wortbildungen“ bezeichnet. Ähnlich wird auf 
die Komplementärgruppe mit „primäre Wörter“ Bezug genommen, auch wenn 
eigentlich „tendenziell primäre Wörter“ passender gewesen wäre, da sich in 
dieser Gruppe neben echten primären Wörtern auch verdunkelte Wortbildun- 
gen finden. Einige dem Korpus entnommenen Vertreter beider Gruppen enthält 
Tab. ı. Sie ist die Hauptquelle für die Beispiele, die weiter unten unsere Ausfüh- 
rungen veranschaulichen. 


Tabelle 1: Primäre Wörter vs. Wortbildungen: Beispiele. 


Primäre Wörter Wortbildungen 
Tor Vater Torfrau Schwiegermutter 
Frau Kabarett Landesgrenze Stiefvater 
Land heute gelblich (das) Heute 
Grenze laufen Volkstum (der) Lauf 
gelb werfen vernehmen (der) Wurf 
Volk leben Gerede (das) Leben 
nehmen grün Dialekt Grüne(r) 
reden das Telearbeit demnach 
Arbeit nach kabarettophil Unflat 


Mutter [L...] identisch [L...] 
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Konstitutive Bausteine von Wortbildungen sind kleinste bedeutungs- bzw. 


funktionstragende Formen, sog. Morphe, die wortfähige Morpheme, gebun- 


dene lexikalische Morpheme und gebundene grammatische Morpheme der 


Kategorie Wortbildungsaffixe reprasentieren.** 


14 


15 


16 


17 
18 


19 


I. Wortfähige Morpheme 


Wortfähige Morpheme im engeren Sinn können freistehend als (primäre) 
Wörter realisiert werden - sie stellen somit sog. freie Morpheme dar. Die 
meisten freien Morpheme weisen eine selbständige Bedeutung auf - als Bei- 
spiele können {tor}, {frau}, {land}, {grenze}, {gelb}, {volk}, {arbeit}, {mutter}, 
{vater}, {kabarett}, {heute} oder {grün} dienen. Sie werden als lexikalische 
Morpheme'? angesehen (vgl. z.B. Brandt et al. 2006: 136-137) und bilden 
sog. Inhaltsworter*® bzw. Autosemantika (vgl. Meibauer et al. 2007: 133), die 
mehrheitlich flektierbar sind. Wortfähig im engeren Sinn ist aber auch eine 
Reihe von Morphemen, die wie {das}’’ und öfter auch {nach} als gramma- 
tisch bezeichnet werden, da ihre Bedeutung unselbständiger erscheint und 
sie ziemlich spezifische grammatische Funktionen ausüben. Freistehend 
werden solche Morpheme als sog. Funktionswörter'* bzw. Synsemantika 
eingestuft. Bereits am Übergang zu gebundenen lexikalischen Morphemen 
sind schließlich Basismorpheme von Verben zu verorten. Sie können näm- 
lich standardsprachlich nur im Imperativ Singular schwacher Verben und 
starker Verben ohne e/i-Wechsel frei - d.h. hier auch - ohne eine explizite 
Flexionsmarkierung realisiert werden (Dudengrammatik 2016: 441-446), 
vgl. leb! bzw. lauf! Linear nicht segmentierbare Verbformen'” wie nahm, 
warf oder nimm! wirf! hingegen können bereits als Kombinationen aus 
Basismorphem und Flexionsmarkierung mittels Vokalwechsel aufgefasst 


Zur Spezifik der Kurzwörter, die sich nicht direkt in Morpheme zerlegen lassen, siehe 
weiter unten. 

Lexikalische Morpheme sind nicht mit Lexemen zu verwechseln, zu denen hier alle 
Wörter im Sinne von Lexikoneinheiten gezählt werden, also auch Funktionswörter, 
vgl. Dudengrammatik (2016: 136-140). 

Zu den Inhaltswörtern werden Substantive, Adjektive, die meisten Verben und Adver- 
bien sowie manchmal auch Präpositionen gezählt. 

Als Determinierer und Pronomen. 

Zu den Funktionswörtern werden vor allem Artikel, Partikeln, subordinierende und 
koordinierende Konnektoren (zuzüglich Adverbkonnektoren, vgl. HDK 1), meist auch 
Präpositionen, Hilfs- und Modalverben, bestimmte Modalwörter und Pronomina 
gezählt, vgl. Willems (2013). 

Der Vokalwechsel begründet kein nur als Flexionsmorphem interpretierbares Seg- 
ment des Wortes. 
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werden.” Basismorpheme von Verben können dennoch als wortfahig in 
einem erweiterten Sinn betrachtet werden: Sie bilden (primäre) Wörter 
ohne Zuhilfenahme eines anderen Morphems der Gruppen Ibis II. 


II. Gebundene lexikalische Morpheme 


Lexikalische Morpheme, die nur gebunden vorkommen, sind fast immer als 
Konfixe einzustufen.” Sie sind typischerweise aus anderen europäischen 
Sprachen entlehnt und wurzeln besonders häufig im Griechischen, wie 
{dia}, {lekt}, {tele}, {phil}, oder Lateinischen, wie fident}. Den Konfixen kön- 
nen außerdem heimische Morpheme wie {schwieger} oder {stief} zugeschla- 
gen werden. Zu gebundenen lexikalischen Morphemen sind am Rande auch 
die in Abschnitt 2 bereits angesprochenen unikalen Morpheme wie {flat} in 
Unflat zu zählen.” 


Die Morpheme der Gruppen I und II können miteinander sowie mit gebundenen 


grammatischen Morphemen der Kategorie Wortbildungsaffixe kombiniert werden. 


II. Wortbildungsaffixe 


Wir sprechen hier einfach von Affixen (vgl. z.B. Fleischer & Barz 2012: 
52-63) bzw. spezifischer von Präfixen wie in ver\nehmen oder Un|flat, Suf- 
fixen wie in gelb|lich oder identlisch und Zirkumfixen wie in Ge|red|e. Diese 
Bezeichnungen verwenden wir in diesem Kapitel, um Verwechslungen zu 
vermeiden, nicht für Flexionsmorpheme (wie in nimmst), die übrig geblie- 
bene Kategorie der gebundenen grammatischen Morpheme. 


Nur die wortfähigen Morpheme (Gruppe I) können ganz alleine in einer Wort- 


bildung eingesetzt werden, vgl. (das) Heute oder (der) Lauf (zur sog. morpholo- 


gischen Konversion vgl. z.B. Eisenberg 2013: 280). Baut eine Wortbildung dem- 


gegenüber auf zwei oder mehr Morphemen der Gruppen I bis III auf, betrachten 


wir sie als komplexes Wort. Jedes komplexe Wort muss mindestens ein Morph 


enthalten, das entweder ein wortfähiges Morphem oder ein gebundenes lexika- 


lisches Morphem repräsentiert. 


20 


21 


22 


Donalies (2002: 20) fasst dennoch die „Verbstämme des Typs ess-, geb- oder les-“ (folg- 
lich wohl auch nehm- oder werf-) als frei vorkommend auf. 

Vgl. Donalies (2002: 21-23), Fleischer & Barz (2012: 63-64). Verschiedene Konfixtheo- 
rien werden in Donalies (2009) diskutiert. 

Zum Unterschied zwischen unikalen Morphemen und Konfixen vgl. Meibauer et al. 
(2007: 31). 
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In ihrer Minimalform basieren komplexe Wörter auf zwei Morphemen. Die 


Zusammensetzungs- und Reihenfolgeoptionen des Morphempaares sind folgen- 


der Auflistung zu entnehmen: ”? 


1. zwei wortfähige Morpheme, z.B. Tor|frau 


2. ein gebundenes lexikalisches Morphem (A) und ein wortfähiges Morphem (B): 


a. A+B,z.B. Tele|arbeit 
b. B+A,z.B. kabarett(o)|phil* 


3. zwei gebundene lexikalische Morpheme, z.B. Dia|lekt 
4. ein wortfähiges Morphem (A) und ein Affix (B):?° 


a. A+B, z.B. gelb|lich (Suffigierung) 
b. B+A,z.B. ver|nehm- (Prafigierung) 


5. ein gebundenes lexikalisches Morphem (A) und ein Affix (B): 


a. A+B, z.B. identlisch (Suffigierung) 
b. B+A,z.B. Un|flat (Präfigierung) 


Es werden alle Reihenfolgemöglichkeiten genutzt, auch wenn die Optionen 2b 


und 5b weit seltener erscheinen als die anderen.”° Die Verbindungstypen 1 bis 3 


werden der Komposition zugerechnet, 4 und 5 der Derivation. Komposition und 


Derivation werden zusammen mit Konversion in weiteren Abschnitten differen- 


zierter betrachtet und im Kapitel „Wortbildungsarten“ genauer analysiert. 


Wortbildungsprozesse sind im Allgemeinen rekursiv. Das heißt hier, dass sich 


Verbindungen von Morphemen der Gruppen I bis III zum einem mit weiteren 


Morphemen der Gruppen I bis M, zum anderen mit weiteren Verbindungen von 


23 


24 


25 
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Für eine Übersicht, die sich nicht nur auf komplexe Wörter in ihrer Minimalform 
beschränkt und auch Fugenelemente zur Unterscheidung von Kombinationsmöglich- 
keiten verwendet, vgl. Donalies (2002: 49). 

Eingeklammert ist das Fugenelement, das keinen Morphemstatus besitzt - dazu wei- 
ter unten. 

Weggelassen werden hier der Einfachheit halber Verbindungen mit Zirkumfixen, die 
als Kombinationen aus Präfigierung und Suffigierung betrachtet werden können. 
Wird ein wortfähiges Morphem vor ein gebundenes lexikalisches Morphem gesetzt 
(2b), muss das vorangehende Wort häufig erst durch ein Fugenelement (vgl. -o- in 
kabarett(o)|phil) anschlussfähig für das darauf folgenden Konfix gemacht werden 
(wobei die Zusammensetzung oft immer noch ungewöhnlich klingt); die Verbindung 
eines Präfixes mit einem gebundenen lexikalischen Morphem (5b) scheint sich wiede- 
rum auf unikale Morpheme wie {flat} zu beschränken. 
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Morphemen der Gruppen I bis M zu noch komplexeren Bildungen vereinen kön- 
nen. Etwas pauschaler ausgedrückt: Komplexe Wörter können sich zusammen mit 
anderen Wörtern sowie mit Konfixen und Affixen zu noch komplexeren Wör- 
tern verbinden.” Dabei können die Verbindungen im Deutschen bekanntlich eine 
sehr hohe Komplexität erreichen wie in den Korpusbeispielen Gemeinnützigkeit(s) 
entbürokratisierung(s)gesetz oder Bund(es)verfassung(s)gericht(s)entscheidung(s) 
sammlung. Wie solche Bildungen zu analysieren und hinsichtlich ihres Komplexi- 
tätsgrades zu bewerten sind, wird später im Kapitel „Wortbildungsarten“ diskutiert. 
Neben den Morphemen der Gruppen I bis M können komplexe Wörter auch 
Fugenelemente und Flexionsmarkierungen enthalten. Fugenelemente” wur- 
den in den gerade genannten Beispielen eingeklammert (vgl. dementsprechend 
auch Land(es)|grenze, Volk(s)|tum, kabarett(o)|phil), da ihnen der Morphemstatus 
meist abgesprochen wird (dazu Kopf 2018: 8-9). Sie sorgen nicht für eine Kom- 
plexitätserhöhung, sondern sind lediglich deren mögliche Begleiterscheinung.” 
Die heimischen Fugenelemente wie -s- oder -es- haben ihren Ursprung in Fle- 
xionsendungen, werden aber aus synchroner Sicht in der Regel nicht als deren 
Realisierungen eingestuft (vgl. z.B. Nübling & Szczepaniak 2009: 197).”° 
Flektierbare Wörter gehen in die Wortbildungen meist als unflektierte 
Stämme ein. Flexionsmarkierungen sind für Wortbildungen auch nicht kon- 
stitutiv. Das heißt vor allem, dass Wortformen, die als Verbindungen aus einem 
lexikalischen Morphem und einem Flexionsmorphem erscheinen (z.B. Torles, 
Ländler, nimm |st, leb|te) oder durch Vokalwechsel markiert sind (z.B. nahm, warf 
oder nimm! wirf!), nicht als komplexe Wörter betrachtet werden. Entsprechend 
werden alle Konversionen aus primären Wörtern nicht als komplexe Wörter 
gewertet. Dies gilt für die schon erwähnten morphologischen Konversionen (vgl. 
Eisenberg 2013: 280-284) wie (der) Lauf, bei denen eine unflektierte Wortform 
(ein Stamm) direkt zur unflektierten Grundform einer anderen Wortart „konver- 
tiert“. Das gilt aber auch für sog. implizite Ableitungen wie Wurf (vgl. Eisenberg 
2013: 280)” oder offenkundig syntaktisch entstandene Infinitivkonversionen 


27 Vgl. Donalies (2002: 15) zu den Möglichkeiten der Wortschatzerweiterung. 

28 Sie werden genauer in einem getrennten Kapitel ,Substantivkomposition und Fugen- 
elemente“ behandelt. 

29 Dies ist bei Minimalpaaren wie Vermögen|steuer vs. Vermögen(s)|steuer unmittelbar 
sichtbar. Zur Funktion von Fugenelementen s. die Übersicht in Nübling & Szczepa- 
niak (2009: 201-208). 

30 Speziell zu Fugenelementen als Nicht-Kasus-Suffixen s. Gallmann (1999). Für eine dif- 
ferenzierte Sicht auf die Semantik der Fugenelemente vgl. Donalies (2002: 46-48) und 
Kopf (2018: 54-72). 

31 Donalies (2002: 135) wertet solche Fälle als Konvertate aus spezifischen, u.U. veralte- 
ten Verbstämmen (z.B. dem mhd. Präteritumstamm wurf, vgl. auch Fleischer & Barz 
2012: 89). Wir werden sie im Kapitel „Wortbildungsarten“ diskutieren. 
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wie (das) Leben, die einen (ehemals) flexionsrelevanten Vokalwechsel respektive 
die Infinitivendung konservieren. Substantivierte Adjektive wie (die/der) Grüne 
(etwa im Sinne einer Person, die durch ihre politische Orientierung charakteri- 
siert wird) stellen hier nur insofern einen Sonderfall dar, als sie nicht lediglich 
ein bestimmtes Flexionsmerkmal des Ausgangswortes behalten, sondern große 
Teile des adjektivischen Flexionsparadigmas in den nominalen Gebrauch inte- 
grieren (zur syntaktischen Konversion vgl. z.B. Eisenberg 2013: 280). Produkte 
aller genannten Konversionsarten gehören in unserer Auffassung also nicht zu 
den komplexen Wörtern, sondern sind zusammen mit primären Wörtern zu den 
einfachen Wörtern (den Simplizia) zu zahlen.** Sie bleiben nichtsdestoweniger 
Wortbildungen, denn sie gehen auf andere Lexeme bzw. auf Wörter einer ande- 
ren Wortart zurück. 

In die weiter oben beschriebene, aus formaler Sicht rein additive „Aufbau- 
mechanik“ komplexer Wörter fügen sich auch einige etwas weniger typische 
Bildungen ein. In diesen können an die Stelle eines Wortes, welches das Erstglied 
eines Kompositums bildet, zum einen nicht wortfähige Gruppen von Morphe- 
men (Kurzzeit|gedächtnis), Wortgruppen (Saure-Gurken-Zeit) und sogar satz- 
artige Konstrukte (Trimm-Dich-Pfad), zum anderen etwa einzelne Buchstaben 
bzw. ihre Bezeichnungen (S-Kurve) treten.” Einige dieser Ausdrucksformen kön- 
nen auch als Basis für Konversionen dienen, vgl. (das) Stelldichein, das auf einen 
Imperativsatz zurückgeführt werden kann (Fleischer & Barz 2012: 65, Henzen 
1965: 83-84). 

Es gibt jedoch auch Bildungen, die den additiven Regularitäten nicht direkt 
folgen. Zu denken ist hier vor allem an Kurzwörter und Kontaminationen (vgl. 
z.B. Fleischer & Barz 2012: 91, 93-94). Bei den eher randständigen Kontaminati- 
onen sind die Ausgangskomponenten meist immer noch leicht rekonstruierbar 
(vgl. jein, Denglisch oder - aus dem Englischen - Brexit). Insofern liegt die Klas- 
sifizierung der Kontaminationen als komplex nahe. Die viel häufigeren Kurzwör- 
ter (vgl. Fleischer & Barz 2012: 91, Balnat 2011: 287-289) sind ein komplizierterer 


32 Konversionen bzw. sog. implizite Ableitungen aus primären Wörtern als einfache 
Wörter zu betrachten, hat eine lange Tradition. Schon nach Grimm hebt die „[ilnnere 
Wortbildung [...] die Einfachheit des Wortes nicht auf“ (Grimm 1826: ı). 

33 Die Reihe kann mit weiteren, eher randständigen Erstgliedtypen fortgesetzt werden, 
z.B. Kombinationen aus Zahlwörtern und Präpositionen (geschrieben als Ziffern mit 
Trennzeichen) wie in 1:8-Debakel. Beachtenswert ist der häufige Gebrauch des Binde- 
striches zwischen Erst- und Zweitglied des Kompositums bei Wortgruppen, Sätzen, 
Buchstaben etc. als Erstglied. Der Bindestrich wird bei Wortgruppen und Sätzen auch 
innerhalb des Erstglieds eingesetzt. Zu den Gründen für die Bindestrichsetzung in 
ähnlichen Fällen vgl. Kopf (2018: 119-120). 
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Fall.** Sie stellen zwar Reduktionen von fast ausschließlich komplexen Wörtern 
oder von Wortgruppen dar, die Ausgangskomponenten sind aber selten aus dem 
Kurzwort erschließbar und den Sprachbenutzer/inne/n in der Kommunikations- 
situation öfter nicht präsent (vgl. Dudengrammatik 2016: 680). Außerdem kann 
ein Kurzwort die Langform weitgehend aus dem Sprachgebrauch verdrängen 
und sich damit noch stärker einem primären Wort annähern (tendenziell bei 
Labor gegenüber Laboratorium). Dies zeigt einerseits, dass Kurzwörter tatsäch- 
lich eigenständige Wörter sind (auch wenn sie die Bedeutung der Langform und 
ihre grammatischen Merkmale behalten).”” Es macht andererseits die Entschei- 
dung schwer, sie pauschal den Simplizia oder den komplexen Wortbildungen 
zuzuschlagen (vgl. Dudengrammatik 2016: 748). 

Wir fassen Kurzwörter als mit ihren Langformen teilweise synonyme 
Lexeme auf und verwenden zur Bewertung ihrer Komplexität wie bei anderen 
Bildungen das Kriterium der formalen Repräsentation der Ausgangskomponen- 
ten. So zählen wir unisegmentale Kurzwörter,?° die auf ein Morphem oder einen 
Morphemteil der Langform gekürzt sind - wie Labor[atorium], Ober[kellner], 
Zoo[logischer Garten] bzw. Alu[minium], Krimi[nalroman/-film] -, zusammen 
mit primären Wörtern zu den einfachen Wörtern bzw. den Simplizia. Alle ande- 
ren Kurzwörter betrachten wir als komplex. Hierzu gehören alle multisegmen- 
talen Kurzwörter - unabhängig davon, ob sie als Silben- oder Buchstabenwörter 
(z.B. Schiri, Kita bzw. GmbH, Kfz, GAU, TÜV) erscheinen und ob sie gebunden 
(Schiri, Kita, GAU, TÜV) oder mit den Buchstabennamen (GmbH, Kfz) ausgespro- 
chen werden. Da alle Kurzwörter aus unserer Sicht Wortbildungen sind, geht die 
Unterscheidung von primären Wörtern und Wortbildungen auch an dieser Stelle 
nicht mit der Unterscheidung von Simplizia und komplexen Wörtern einher. 


34 Fleischer & Barz (2012: 277) sehen in der Kurzwortbildung eine Wortbildungsart. 
Eichinger (2000: 34) schreibt differenzierter: „In gewisser Weise haben [...] die Kurz- 
wörter mehr vom Phraseologismus als von der eigentlichen Wortbildung - das Kurz- 
wort ist eine Art Metapher der Ausdrucksform“. 

35 Bei Wortgruppen richten sich Kurzwörter grammatisch meist nach dem Kopf der 
Langform. Zwischen Kurzwort und Langform kann es aber Bedeutungsverschie- 
bungen und konnotative Unterschiede geben (vgl. Balnat 2011: 110-117). Allerdings 
ist deren Entstehung dem eigentlichen Wortbildungsprozess nachgeordnet. So kann 
BAföG anders als Bundesausbildungsförderungsgesetz auch die aufgrund des Bun- 
desausbildungsförderungsgesetzes gezahlte Unterstützung bedeuten (https://www. 
duden.de/rechtschreibung/BAfoeG, abgerufen am 8.6.2020). Wie nah sich ein Kurz- 
wort und seine Langform semantisch stehen, könnte korpuslinguistisch automatisiert 
geprüft werden, indem in einem Word-Embedding-Modell die Distanz der beiden For- 
men zueinander gemessen würde (vgl. Bubenhofer et al. 2019: 222-226). 

36 Vgl. Fleischer & Barz (2012: 277-279) und - etwas differenzierter - Donalies (2002: 


144-146). 
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Wortbildungen 


Simplizia komplexe Wörter 


primäre Wörter 
Tor (das) Gelb Torfrau 
Frau (das) Heute Landesgrenze 
Land (der) Wurf gelblich 
Grenze (das) Leben Biotop 
gelb Grüne(r) Ökosteuer 
heute Zoo Schwiegermutter 
werfen Ober Schiri 
leben Krimi GAU 
grün Alu Kfz 


Abbildung 1: Primäre Wörter und Wortbildungen vs. Simplizia und komplexe Wörter. 


Abb. ı veranschaulicht zusammenfassend die Unterschiede zwischen den beiden 
Begriffspaaren anhand ausgewählter Beispiele. 


4 Allgemeine quantitative Verhältnisse und 
Wortschatzerweiterung 


Die automatisch als Wortbildungen analysierten Wörter machen im gesam- 
ten Untersuchungskorpus 28,5% der über 5,8 Milliarden Tokens aus, die in 
der Canoo-basierten Annotation als Wörter behandelt werden. Der tatsäch- 
liche Anteil der Wortbildungen im Untersuchungskorpus muss höher liegen, 
da automatisch - insbesondere bei seltenen Wörtern - einige Wortbildungen 
nicht als solche analysiert werden. Um die quantitativen Verhältnisse zwischen 
Wortbildungen und primären Wörtern genauer zu untersuchen, wird daher 
das Teilkorpus gok herangezogen, das manuell bearbeitet werden konnte und 
über eine halbe Million relevante Worttokens umfasst, die sich auf knapp 50.000 
TreeTagger-Lemmata” verteilen (vgl. Abschnitt 1 oben). Der Anteil der Wort- 
bildungen beträgt in diesem Teilkorpus bei den Tokens 31,8% (177.202). Bei den 
Lemmata liegt er mit 91,5% (44.746) viel höher. Der sehr deutliche Unterschied 
zwischen Tokens und Lemmata erklärt sich daraus, dass Wortbildungslemmata 


37 Wir verwenden hier den Terminus Lemma anstatt des evtl. zu erwartenden Typ (engl. 
type), um klarzustellen, dass es sich um eine im Tagging zugewiesene Kategorie han- 
delt, die einem Lexem entsprechen soll. Typ lässt ungünstigerweise die Ambiguität 
zwischen einer Wortform (der die Tokens im Korpus entsprechen) und einem Lexem 
(das etwa bei flektierenden Wortarten mehrere Wortformen umfasst) zu. 
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Abbildung 2: Anteil der Wortbildungslemmata nach Häufigkeitsklassen im Teil- 
korpus 40k: Je höher die Häufigkeitsklasse, desto tokenärmer die Lemmata, wobei: 
hk = [log2 (f (‚der, die, das‘) / f (Lemma)) + 0,5]. Die Zahlen in den Säulen geben die 
Anzahl der Wortbildungslemmata in der Häufigkeitsklasse an. 


tendenziell tokenarm sind (66,0% davon sind Hapaxlegomena?”) und es unter 
den besonders tokenreichen Lemmata gar keine Wortbildungen gibt. Teilt man 
alle Lemmata in Häufigkeitsklassen ein, so lässt sich in den Klassen, die Wort- 
bildungen enthalten, Folgendes beobachten: Je weniger Tokens die Lemmata 
einer Häufigkeitsklasse aufweisen, desto größer der Anteil der Wortbildungen 
(vgl. Abb. 2). Es ist davon auszugehen, dass sich das auch in größeren Korpora 
so wiederfindet.” 

In der Rangliste der 100 häufigsten Lemmata des Teilkorpus (vgl. Tab. 2 
unten) findet sich das erste als Wortbildung analysierte Wort erst auf Rang 77. 
Das Fremdwort Prozent ist Canoo zufolge eine Zusammensetzung aus zwei „neo- 
klassischen Formativen“.‘ Der erste Bestandteil der Bildung kann (allerdings 
anders als ein Konfix) auch frei auftreten wie in pro Jahr oder pro Liter Ben- 
zin (neben weiteren gebundenen Verwendungen wie in prowestlich oder pro(-) 
amerikanisch), der zweite Bestandteil lässt sich in Zentimeter, Zentiliter u. Ä. 


38 Bei den primären Wörtern beträgt der Anteil der Hapaxlegomena 27,4%. Auch in 
Baayens (vgl. 2001: 135-138) Untersuchungen zu den Häufigkeiten niederländischer 
Wörter ist der Anteil der Hapaxlegomena bei den Ableitungen auf -heid viel höher als 
bei substantivischen Simplizia. 

39 Vgl. auch dazu die prinzipiell in die gleiche Richtung zeigenden Ergebnisse von 
Baayen (2001: 135-138). 

40 Vgl. http://www.canoonet.eu/services/WordformationRules/Neoklassisch/Intro.html? 
Menuld=WordFormation1 12 (abgerufen am 3.11.2019). 
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Tabelle 2: Die Wortbildungen (hervorgehoben) unter den 100 häufigsten Lemmata im 
Teilkorpus 40k (HK=Häufigkeitsklasse). 


Rang | Lemma Frequenz HK Rang | Lemma Frequenz HK 
1 die 68.695 0 34 noch 1.966 6 
2 in 17.759 2 35 vor 1.916 6 
3 und 14.508 3 36 so 1.863 6 
4 eine 13.814 3 37 alle 1.765 6 
5 sein 11.714 3 38 uber 1.652 6 
6 | zu 8.628 3 39 bis 1.592 6 
7 werden 7.406 4 40 nur 1.564 6 
8 von 6.776 4 41 müssen 1.555 6 
9 haben 6.658 4 42 sollen 1.516 6 

10 mit 5.924 4 43 sagen 1.484 6 
11 an 5.894 4 44 geben 1.476 6 
12 für 4.825 4 45 Uhr 1.330 6 
13 auf 4.779 4 46 Sie 1.318 6 
14 sich 4.722 4 47 mehr 1.245 6 
15 nicht 4.274 5 48 man 1.236 6 
16 es 4.199 5 49 neu 1.228 6 
17 auch 3.828 5 50 wollen 1.216 6 
18 er 3.453 5 51 oder 1.203 6 
19 bei 3.361 5 52 | gut 1.200 6 
20 als 3.109 5 53 keine 1.194 6 
21 dass 2.790 5 54 aber 1.137 6 
22 aus 2.705 5 55 kommen 1.093 6 
23 sein 2.693 5 56 unter 1.041 7 
24 können 2.665 5 57 groß 1.021 7 
25 dies 2.660 5 58 wenn 1.016 7 
26 nach 2.578 5 59 gegen 998 7 
27 ihr 2.522 5 60 gehen 993 7 
28 wir 2.477 5 61 durch 975 7 
29 ich 2.344 5 62 machen 968 7 
30 | sie 2.328 5 63 schon 950 7 
31 um 2.159 5 64 andere 938 7 
32 wie 2.130 6 65 viele 889 7 
33 Jahr 2.114 6 66 dann 860 7 
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Tabelle 2. Fortsetzung 


Rang Lemma Frequenz | HK Rang Lemma Frequenz | HK 
67 erst 836 7 84 | jede 561 7 
68 zwei 821 7 85 nun 549 7 
69 wieder 815 7 86 bereits 545 7 
70 was 787 7 87 heute 538 7 
71 stehen 756 7 88 unser 529 8 
72 aber 730 7 89 damit 525 8 
73 lassen 700 7 90 dabei 518 8 
74 immer 699 7 91 beide 515 8 
75 ab 685 7 92 Frau 515 8 
76 seit 670 7 93 Kind 512 8 
77 Prozent 650 7 94 sehr 509 8 
78 sehen 641 7 95 hier 507 8 
79 weit 632 7 96 stellen 498 8 
80 | finden 622 7 97 Tag 489 8 
81 jetzt 620 7 98 Mensch 487 8 
82 drei 611 7 99 Zeit 483 8 
83 ganz 583 7 100 weil 477 8 


erkennen. Die restlichen automatisch als Wortbildungen analysierten Lemmata 
der Rangliste aus Tab. 2 stellen Adverbien dar, deren synchrone Analysierbarkeit 
offensichtlich ist (bereit|s, da|mit, da|bei). Nicht als Wortbildungen analysiert 
wurden übrigens Fälle wie dass (Rang 21) oder weil (Rang 100), die man in einer 
historischen Betrachtung mit dem Pronomen das respektive dem Substantiv 
Weile hätte in Verbindung bringen müssen. Wir fassen sie aber als nicht ein- 
schlägig auf, da sie sich von den Basiswörtern bedeutungsmäßig bzw. funktional 
und teilweise auch formal zu sehr isoliert haben, als dass sie ohne Weiteres als 
synchron analysierbar betrachtet werden können. 

Die obersten Positionen der Rangliste werden dominiert durch Funktions- 
wörter, vor allem Determinierer, Präpositionen und Pronomina.** Auch die 
ersten auftauchenden Verblemmata (sein, werden, haben, können, müssen, sol- 
len) werden zum großen Teil als Kopula-, Hilfs- oder Modalverben realisiert, 
die ebenfalls zu den Funktionswörtern gezählt werden können. Die häufigsten 


41 Das Lemma eine (Rang 4) steht für Determinierer, Pronomen und Zahlwort, sein 
(Rang 5) für Verb, sein (Rang 23) für Determinierer und Pronomen und dies (Rang 25) 
ebenfalls für Determinierer und Pronomen. 
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Lemmata verweisen auf einsilbige Tokens - Ausnahmen finden sich unter den 
ersten 30 Lemmata bei einzelnen Wortformen der oben genannten Verben (z.B. 
sein, bin, bist etc. - einsilbig vs. waren, gewesen etc. - mehrsilbig) und des Deter- 
minierers/Pronomens/Zahlworts ein(e). Die ersten sonstigen Lemmata, die für 
Inhaltswörter stehen, erscheinen auf der Liste erst später und gehören wie die 
Substantive Jahr (Rang 33) und Uhr” (Rang 45) oder die Verben sagen (Rang 43) 
und geben (Rang 44) den primären Wörtern an. 

Festzuhalten ist, dass besonders häufige Wörter funktionale Ausdrücke dar- 
stellen, die kurz und primär sind. Auch die häufigsten Inhaltswörter sind kurz 
und primär. Bei besonders seltenen Wörtern hingegen überwiegen bei Weitem 
die Wortbildungen. Dabei sind unter den besonders seltenen Wörtern, insbeson- 
dere unter den Hapaxlegomena, die meisten Neupragungen* zu erwarten (vgl. 
Baayen 2009: 905-906), und so ist die hohe Anzahl niederfrequenter Wortbil- 
dungen ein Indiz dafür, dass der Gesamtwortschatz durch Wortbildung immer 
weiter ausgebaut werden kann. Demgegenüber erscheint der Bestand an pri- 
mären Wörtern nur beschränkt erweiterbar. Die Schöpfung neuer Wörter ohne 
Anschluss an vorhandenes Sprachmaterial (Urschöpfung oder auch einfach Wort- 
schöpfung genannt) spielt in der Gegenwartssprache kaum eine Rolle.” Sie ist 
weitgehend beschränkt auf Onomatopoetika® und Produktnamen (vgl. Donalies 
2002: 17-18, Fleischer & Barz 2012: 18-20). An der Wortschatzerweiterung sind 
neben der Wortbildung vor allem die Entlehnung (Computer, cool, Interface, 
Slot, Smartphone) und die Bedeutungsveränderung bzw. -erweiterung (geil für 
‚großartig‘, Netz für ‚Internet‘, Rechner für ‚Computer‘) beteiligt. Wohlgemerkt, 


42 Das Lemma Uhr ist nur deshalb so häufig, weil es in Uhrzeitangaben wie um 14.30 Uhr 
auftritt. Gerade dort verhält es sich aber nicht wie ein typisches Substantiv (es ist 
nicht flektierbar, nicht erweiterbar etc.). 

43 Neu- bzw. Spontanbildungen sind etwa in folgenden Hapaxlegomena aus dem Kor- 
pus zu vermuten: ananasbeglückt, Bibliothekszwilling, kohlhäsisch, Kohl-Lafontaine- 
Weizsäcker-Vollmer-Mischung, valutadeutsch, wohlfahrtsvernünftig, wurmisch, (das) 
Zerlesenswerden. 

44 Anders als eine neue Wortbildung, die Assoziationen zu bereits bestehenden Wör- 
tern wecken kann, kann ein gerade eingeführtes primäres Wort nur in einem abso- 
lut eindeutigen Kontext verstanden werden - etwa gestisch begleitet oder versehen 
mit einer Bedeutungserklärung wie „Sitt [...] ist ein Kunstwort, das als Adjektiv das 
Gegenteil von durstig bedeuten [...] soll“ (https://de.wikipedia.org/wiki/Sitt, abgeru- 
fen am 8.6.2020). 

45 Allerdings sieht Donalies (vgl. 2002: 18, 91) in Verben aus Onomatopoetika (z.B. 
miauen oder platschen) bereits Wortbildungen. Hingegen betrachtet sie die Substan- 
tive Kuckuck und Wauwau als onomatopoetische Urschöpfungen (vgl. auch Fleischer 
& Barz 2012: 19). Henzen (vgl. 1965: 6-7) geht bei onomatopoetischen Verben dann 
von Wortbildungen aus, wenn sie verbale Suffixe -r- bzw. -I- wie in plappern oder 
bimmeln aufweisen. 
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die entlehnten Wörter können auf primäre Wörter (cool, slot) oder Wortbildun- 
gen (computer, interface, smart phone) der Gebersprache zurückgehen. Letztere 
werden nicht selten auch im Deutschen als Wortbildungen empfunden (Inter- 
face, Smartphone), da sie mit anderen geläufigen Wortbildungen (Intercity, inter- 
national bzw. Smartboard, Smartcard, Smart-TV) leicht assoziierbar sind. Sie sind 
somit synchron analysierbar und auch erklärbar. Der Wortbildungsursprung 
eines Fremdworts kann im Deutschen manchmal aber auch kaum zu erkennen 
sein wie bei Aids‘° oder Laser, die im Englischen als multisegmentale Kurzwörter 
entstanden sind. Solche Entlehnungen können wie primäre Wörter wahrgenom- 
men werden (vgl. dazu Dudengrammatik 2016: 744) und sind als synchron nicht 
analysierbar zu betrachten. 

In einem umfangreichen Korpus können nicht alle Fremdwörter aufgespürt 
und daraufhin überprüft werden, ob sie synchron analysierbar sind, und selbst 
wenn das möglich gewesen wäre, hätte es bei einzelnen Entscheidungen öfter 
Interpretationsspielraum gegeben.” Wir stützen uns daher beim Gesamtkorpus 
auch bei Fremdwörtern auf die Ergebnisse der automatischen Wortbildungs- 
analysen von Canoo, die punktuell überprüft und korrigiert werden. In diesen 
werden von den oben genannten Fremdwörtern nur die ältere Bildung internati- 
onal sowie die neueren Smartcard und Smartboard als Wortbildungen dargestellt. 
Vereinbar mit unseren Überlegungen werden Aids, Radar und Computer nicht als 
Wortbildungen analysiert, ebenso wenig aber - diesmal nicht mit unseren Über- 
legungen konform - Intercity, Interface, Smartphone und Smart-TV. Die Anno- 
tation von Belegen wie den letzteren wird, sofern die Fehler gefunden werden, 
korrigiert. Was sich hier zeigt, gilt für die Nutzung der Wortbildungsannotation 
zur Suche nach Wortbildungen im Fremdwortbereich insgesamt. Die Annotation 
ist relativ präzise, zeigt jedoch Recall-Schwächen. 
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Die relative Häufigkeit von Wortbildungen variiert von Wortart zu Wortart und 
auch von einer Teilklasse innerhalb einer Wortart zur anderen. Näher betrach- 
tet werden hier in diesem Zusammenhang die Wortarten Substantiv, Adjektiv, 
Verb und Adverb, deren Lexembestand in größerem Maße erweiterbar ist. Sie 


46 Durch die ebenfalls gebräuchliche Großschreibung AIDS wird das Wort als Kurzwort 
(Buchstabenwort) gekennzeichnet, was es formal wieder zur Wortbildung macht. 

47 So könnte Computer von manchen als synchron nicht analysierbar und nicht erklär- 
bar aufgefasst werden, von anderen aber als analysierbar in ein Wortbildungsmor- 
phem {-er} und ein Konfix {comput-}, das in unserem Korpus noch in dem Ausdruck 
(ubiquitäres) Computing vorkommt. 
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Abbildung 3: Anteil der Wortbildungen bei den erweiterbaren Wortarten im Untersu- 
chungskorpus anhand des Teilkorpus 40k (jeweils mit einem 95 %-Konfidenzintervall). 


setzen sich in erster Linie aus Inhaltswörtern zusammen und werden allgemein 
als offene Klassen angesehen. 

Substantive und Adjektive sind deutlich wortbildungsfreundlicher als Adver- 
bien und Verben. Abb. 3 zeigt den für das Teilkorpus 40k ermittelten Anteil der 
Wortbildungen an allen Tokens bzw. Lemmata der vier Wortarten.** 


48 Zu der Zählweise ist zu bemerken, dass Partikelverben nur dann als ein Wort einge- 
stuft werden, wenn sie im Text zusammengeschrieben erscheinen. Bei der Distanzstel- 
lung der Partikel (bzw. Getrenntschreibung des Partikelverbs) wird die abgetrennte 
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Der Unterschied zwischen dem verhältnismäßig niedrigen Anteil der Wort- 
bildungen an den Tokens und ihrem durchgehend deutlich höheren Anteil an 
den Lemmata ist besonders ausgeprägt bei Verben und Adverbien. Dies kann 
schon daran liegen, dass es einige hochfrequente Verb- und Adverblemmata 
gibt, die primäre Wörter sind (z.B. sein, werden, haben bzw. auch, noch, so, vgl. 
Tab. 2 weiter oben). Bei allen vier Wortarten ist der Anteil der Wortbildungen 
an allen Lemmata allerdings abhängig von der Größe des Teilkorpus. Wird 
diese erhöht, steigen die Anteile der Wortbildungen im Bereich der Lemmata 
bei allen vier Wortarten an, während ihre Anteile im Bereich der Tokens rela- 
tiv unveränderlich bleiben. Hier wirkt sich die Produktivität der Wortbildungen 
aus: Mit wachsender Anzahl berücksichtigter Tokens kommen bei Wortbildun- 
gen schnell neue Lemmata dazu, wogegen bei primären Wörtern die Anzahl 
der Lemmata viel verhaltener ansteigt. Abb. 4 zeigt die Wortschatzwachstums- 
kurven*, die mithilfe des Softwarepakets zipfR unter Anwendung des finiten 
Zipf-Mandelbrot-LNRE-Modells (vgl. Evert & Baroni 2007) allen Wortbildungen 
und allen tendenziell primären Wörtern im Teilkorpus 40K zugeordnet werden 
können. 

Während die Wachstumskurve für die Wortbildungslemmata auch am rech- 
ten Rand der Abb. 4 immer noch relativ steil ansteigt, flacht die Wachstumskurve 
für die Lemmata primärer Wörter sehr schnell ab, sodass ihr Anstieg bald kaum 
mehr bemerkbar ist. Ähnliches zeigt sich beim Vergleich der Kurven für die 
Hapaxlegomena (unter diesen sind die meisten Neuprägungen zu erwarten): Die 
Kurve für die Wortbildungen steigt am rechten Rand der Abbildung immer noch 
deutlich an, während die Kurve für die primären Wörter da sogar bereits abfällt. 
Aus diesen Vergleichen kann man erneut auf die grundsätzliche Produktivität 
der Wortbildungsprozesse und die vergleichsweise geringe Bedeutung der Wort- 
schatzerweiterung durch primäre Wörter schließen.’ Zu prinzipiell ähnlichen 
Ergebnissen kommen Roth (vgl. 2014: 177-182) beim Vergleich verschiedener 


Partikel separat gezählt (z.B. in Verspätungen setzen sich wie in einer Kettenreaktion 
weiter fort) und das übrig gebliebene Verb wird, sofern es nicht weiter analysierbar 
ist, als primär klassifiziert. Die Überprüfung einer Stichprobe ergab, dass sich unter 
den als primär eingestuften Verbtokens 5,8% + 2,3% (n=400, 95 %-Konfidenzintervall) 
Verben befinden, zu denen eine Verbpartikel in Distanzstellung gehört. Wenn man 
die entsprechenden Partikelverben zu den Wortbildungen zählen würde, würde der 
Anteil der Wortbildungen an allen Verbtokens also leicht (um ca. 4 Prozentpunkte) 
ansteigen. 

49 Auch Vocabulary growth curve (so bei Evert & Lüdeling 2001: 168), Vokabularwachs- 
tumskurve (bei Roth 2014: 169). 

50 Die potenzielle Produktivität P (Quotient aus der Anzahl der Hapaxlegomena einer 
Kategorie und der Anzahl aller Tokens dieser Kategorie, vgl. Baayen 2009) beträgt bei 
382.108 Tokens (beobachtete Tokenanzahl der primären Wörter) 0,0049 für primäre 
Wörter und 0,1213 für Wortbildungen. 
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Abbildung 4: Anzahl der Lemmata (dickere Kurvenlinien) und der Hapaxlegomena 
(dünnere Kurvenlinien) bei steigenden Tokenzahlen berücksichtigter Wortbildungen 
bzw. primärer Wörter im Teilkorpus 40k (gemäß dem finiten Zipf-Mandelbrot-Modell in 
zipfR). Bei den Wortbildungen wurden die Wachstumskurven über die beobachtete An- 
zahl der Tokens (176.266, gestrichelte Linie) hinaus so weit extrapoliert, bis die beobach- 
tete Anzahl der Tokens der primären Wörter (382.108, Ende der Skala) erreicht wurde. 


Kompositionsmuster mit Simplizia im Deutschen sowie bereits Baayen (vgl. 
2001: 135-138) beim Vergleich von Derivationen auf -heid mit simplizischen Sub- 
stantiven im Niederlandischen.** 

Wie zu erwarten, sind Wortbildungen verschiedener Wortarten unterschied- 
lich produktiv (zur Kompositionsproduktivität vgl. Roth 2014: 177-178). Die 
Wortschatzwachstumskurven in Abb. 5 unten lassen auf deutliche Unterschiede 
schließen. Im Teilkorpus gok sind die Wortbildungen besonders produktiv bei 
den Substantiven. Die anderen Wortarten folgen in der Reihenfolge Adjektive®’, 
Verben und Adverbien. Die Wachstumskurve der Lemmata für Adverbien zeigt 
in Abb. 5 kaum mehr Steigung und die Kurven der Hapaxlegomena für Adver- 
bien und Verben sinken am rechten Rand der Abbildung sogar schon.°* 


51 In Baayens Modellen steigen die Wachstumskurven der Worttypes und der Hapaxle- 
gomena bei Derivationen auf -heid immer weiter an, während bei Simplizia die Anzahl 
der Worttypen nicht mehr wächst und die Anzahl der Hapaxlegomena abnimmt, 
sobald höhere Tokenzahlen erreicht werden. 

52 Die Hapaxlegomena-Kurve für Adjektive ist in Abb. 5 durch die Lemmata-Kurve für 
Verben verdeckt. 

53 Die potenzielle Produktivität P für das Ende der Skala (59.561 Tokens) erreicht für 
Substantive 0,2980, für Adjektive 0,0758, für Verben 0,0212 und für Adverbien 0,0009. 
Die Extrapolation der Kurven für Adverbien auf das Vierfache der beobachteten 
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Abbildung 5: Anzahl der Lemmata (dickere Kurven) und der Hapaxlegomena (dünnere 
Kurvenlinien) für verschiedene Wortarten bei steigenden Tokenzahlen anhand des Teil- 
korpus 40k (gemäß dem finiten Zipf-Mandelbrot-Modell in zipfR). Die Wachstumskurven 
wurden auf das Vierfache der beobachteten Anzahl der Tokens der seltensten Wortart 
Adverb extrapoliert. Die gestrichelte Linie zeigt die beobachtete Anzahl der Tokens für 
Adverbien (14.890). 


Unsere Betrachtungen bedürfen einiger teilweise einschränkender Kommen- 
tare. Die traditionellen Wortarten sind auf hohen Abstraktionsniveaus definiert 
und stellen in mancher Hinsicht sehr grobe Oberkategorien dar. Die Unterka- 
tegorien können Teilklassen konstituieren, die bezüglich der Wortbildung dif- 
ferenziert zu betrachten sind. So ist die Wortart Substantiv wie bereits erwähnt 
durch die Einteilung in Appellative und Eigennamen geprägt. Beide Untergrup- 
pen unterscheiden sich deutlich in ihrer Semantik, Pragmatik und Schreibung. 
Eigennamen weisen auch Besonderheiten hinsichtlich der gegenwartssprach- 
lich-synchronen Analysierbarkeit und Erklärbarkeit der Wortbildungsmuster 
auf (vgl. Fleischer & Barz 2012: 179). Hier ist noch einmal zu betonen, dass wir 
in den quantitativen Übersichten nur die ,regularere“ Wortbildung der Appella- 
tive fokussiert und die Eigennamen weitestmöglich ausgeschlossen haben. Fer- 
ner können in den Wortbildungen im Allgemeinen Bausteine erscheinen, die 
stark reihenbildend sind. Dabei handelt es sich nicht nur um Affixe. In appella- 
tivischen Substantiven etwa sind es auch manche kompositionalen Zweitglie- 
der wie das polyseme Werk in Kraft|werk, Kunst|werk oder Studierenden| werk 


Tokenanzahl entspricht der Empfehlung von Evert & Baroni (2005) für noch plausible 
Ergebnisse. 
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(man vergleiche dazu auch das meist schon als Suffix betrachtete -werk” in 
Mauer|werk, Netz|werk, Regel|werk), Stelle in Bau|stelle, Geschäfts|stelle oder 
Halte|stelleund Mann in Ehe|mann, Kauf|mann oder Vorder|mann. Als Adjektive 
wiederum sind viele Kardinal- und Ordinalzahlverwendungen einzustufen, z.B. 
in fünfzehn Jahre oder das fünfzehnte Jahrhundert. Sie bilden potenziell unend- 
liche Reihen aus Formen, die nach einigen wenigen, teilweise idiosynkratischen 
Wortbildungsregeln gebildet werden. Die Zahlwörter können im Übrigen außer 
mit Buchstaben auch mit Ziffern, u.U. unter Zuhilfenahme der Punktsetzung 
wie in der 5. Mai ausgedrückt werden, allerdings wurden solche mit Ziffern ver- 
schriftlichten Zahlwörter von der Untersuchung ausgenommen. Ausgeschlossen 
wurden dabei auch die von einem Punkt gefolgten Ziffern, die sich unter Umstän- 
den als aus Ordinalzahlen abgeleitete Adverbien interpretieren lassen (z.B. ı. im 
Sinne von erstens) - solche Adverbkandidaten waren durch den Tagger nämlich 
ziemlich unzuverlässig klassifiziert worden.’ Die Adverbien insgesamt zerfallen 
in verschiedene Teilklassen, die hinsichtlich der Wortbildung ganz unterschied- 
lich zu charakterisieren sind. So beträgt etwa der Anteil der Wortbildungen an 
Präpositionaladverbien - sie setzen sich aus einem Pro-Element und einer Prä- 
position zusammen - per definitionem 100% (Tokens und Lemmata). Allerdings 
bilden Präpositionaladverbien unter allen Adverbien eher eine kleine Gruppe 
(knapp 7 % der Lemmata), sodass sie die Zählungen zu Adverbien insgesamt nur 
geringfügig beeinflussen. Diese erscheinen also dennoch verhältnismäßig wenig 
wortbildungsfreudig (vgl. Abb. 3 weiter oben). 

Anders als in den oben behandelten Wortarten ist der Lexembestand in 
denjenigen Wortarten, die sich aus Funktionswörtern zusammensetzen, sehr 
beschränkt ausbaufähig. Determinierer, Pronomina und Konjunktionen wer- 
den oft als geschlossene Klassen betrachtet (dazu kritisch Waßner 2002). Cha- 
rakteristisch für diese Wortarten ist eine im Vergleich zu den berücksichtigten 
vier Wortarten überschaubare Anzahl an Lexemen, die teilweise mit sehr hohen 
Tokenzahlen (vgl. Tab. 2 weiter oben) realisiert werden. So entsprechen etwa 
den nur zwölf Formen des bestimmten und des unbestimmten Artikels bzw. 
der gleichlautenden Pronomen (die, der, das, des, dem, den einerseits und eine, 
einer, ein, eines, einem, einen andererseits) im Gesamtkorpus (knapp 6 Mrd. Wort- 
tokens) fast 700 Mio. Tokens. 


54 So z.B. in Fleischer & Barz (2012: 56). 
55 Sie werden im Kapitel „Bau von und Umbau zu Adverbien“ (Brandt in dieser Ausgabe) 
dennoch stichprobenartig untersucht. 
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Die einzelnen Wortarten sind u.a. dadurch charakterisiert, dass sie verschiedene 
Wortbildungsarten unterschiedlich stark gewichten’® und diese mit jeweils spe- 
zifischen Wortbildungsregeln realisieren. Die Verteilung der anhand der Wort- 
bildungsannotation ermittelten Wortbildungsarten auf die Wortarten Substantiv, 
Adjektiv, Verb und Adverb im Teilkorpus gok wird für Tokens und Lemmata 
in Abb. 6 illustriert. Im Anschluss diskutieren wir die wichtigsten Gemeinsam- 
keiten und Unterschiede, die sich beim Vergleich der Wortarten zeigen. Dabei 
werden auch die jeweils auffälligsten Wortbildungsregeln genannt und durch 
Beispiele veranschaulicht. Zum Schluss wird in den Tab. 3 bis 6 eine Übersicht 
über die typischen Wortbildungsregeln der einzelnen Wortarten gegeben. 

In einer ersten formal-kompositionalen Annäherung unterscheiden wir an 
dieser Stelle als Wortbildungsarten lexikalische Verbindung, Suffigierung, Prä- 
figierung und Konversion. Die übrigen Bildungsweisen fassen wir unter „Rest“ 
zusammen. Es sind einige Spezifika dieser Unterteilung zu erläutern. 

Unter lexikalischer Verbindung verstehen wir - provisorisch zusammenge- 
fasst - alle Verbindungen aus wortfähigen Einheiten” und/oder Konfixen als 
unmittelbaren Konstituenten (Fugenelemente werden hier vernachlässigt). Dazu 
gehören vor allem „klassische“ Komposita (vgl. z.B. Schlücker 2012: 8), in denen 
das Zweitglied die gleiche Wortart hat wie die gesamte Wortbildung (Hausltier, 
zahl|reich, darauf|hin). Hier werden aber auch einige abweichende Bildungen 
berücksichtigt, etwa solche, in denen die Verbindung nicht die Wortart des 
Zweitglieds hat (da|mit, dem|nach) und die auch als Univerbierung” betrachtet 
werden können (trotz|dem, in|zwischen, vgl. Donalies 2018: 225-243). Unter Prä- 
figierung findet sich außer den üblicherweise dazugerechneten Fallen (Un|gliick, 
Gelflügel, erklären, Ge|bet) - bedingt durch die Spezifik der automatischen 
Annotation - auch die Zirkumfigierung (Ge|ldnd|e, Ge|web|e). Die Suffigierung 
wiederum umfasst neben den üblichen Fallen (Musik|er, berufllich) die meis- 
ten Zusammenbildungen mit Suffixen (Vier|bein|er, groß|züg|ig) und manche 


56 Eichinger (2000: 74-114) beobachtet aus der umgekehrten Perspektive Präferenzen 
bei der Verteilung der Wortbildungsarten auf die Wortarten Substantiv, Adjektiv, Verb 
und erörtert eingehend die Gründe für solche Präferenzen. 

57 Hierzu gehören wohlgemerkt auch Komponenten, denen lexikalische Bedeutung 
abgesprochen wird (zumindest dem in trotz|dem). Wir verwenden dennoch die 
Bezeichnung lexikalische Verbindung, weil wir hier Komponenten mit lexikalischer 
Bedeutung für prototypisch halten. 

58 Mit Univerbierung kann der Prozess der Zusammenrückung von Wörtern einer Wort- 
gruppe zu einem Einzelwort bezeichnet werden, aber auch ein komplexes Wort, das 
formal einer Wortgruppe gleicht - mit dem Unterschied, dass die Wortgruppe ausei- 
nander geschrieben wird. 
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Abbildung 6: Wortbildungsprofile verschiedener Wortarten: Anteile der Wortbildungs- 
arten. 
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Rektionskomposita (Feuer|spuck|er, Grafitti-|Sprühler).” Unter Zusammenbil- 
dungen verstehen wir dabei - ähnlich wie u.a. Neef (2015: 583-585, zurück- 
gehend auf Leser 1990: 4) - Dreierverbindungen, bei denen weder die ersteren 
beiden noch die letzteren beiden Komponenten mit der in die gesamte Bildung 
integrierbaren Bedeutung wortfähig sind (vgl. *Vierbein, * Beiner bzw. *Großzug, 
*zügig)® - in solchen Fällen geht die Basis der Suffigierung scheinbar auf eine 
Wortgruppe oder Fragmente einer größeren Wortgruppe zurück. Die Konver- 
sion umfasst an dieser Stelle neben den typischen Fällen wie fertigen oder (das) 
Leben auch departizipiale Adjektive und Substantive (spannend, (der/ein) Betrof- 
fene(r)) sowie auch implizite Ableitungen ((das) Verbot < verbieten, (der) Auftritt < 
auftreten). Zum „Rest“ schließlich gehören einige analysierbare, aber von Canoo 
aus verschiedenen Gründen nicht mit einer Regel verbundene Bildungen ((das) 
Alter, ausfindig, schließlich, übrigens). Eine genauere Differenzierung der Wort- 
bildungsarten wird später im gleichnamigen Kapitel ausgearbeitet. 

Der Vergleich des Anteils der lexikalischen Verbindung bei verschiedenen 
Wortarten legt auf den ersten Blick ihre paarweise Gruppierung nahe. Subs- 
tantive und Adverbien ähneln sich darin, dass sie besonders durch lexikali- 
sche Verbindungen geprägt sind. Bei den Substantiven fallen insbesondere 
determinativ analysierbare Komposita aus zwei substantivischen Konstituen- 
ten wie Wochen|ende, Stadt|rat, Verzichts|planung ins Gewicht,” in größerem 
Abstand gefolgt von Komposita mit einer adjektivischen Erstkonstituente wie 
Alt|papier, Neu|verschuldung, Halb|zeit und solchen mit einer verbalen Erstkon- 
stituente wie Warte|zeit, Fahr|zeug, Halte|stelle. Etwas seltener, aber immer noch 
sehr zahlreich sind Komposita mit einer präpositionalen Erstkonstituente wie 
Mit|glied, Auf|takt, Gegen|rede und Konfixverbindungen wie Tele|fon, Dia|lekt, 
Gastro |nom. 

Bei den Adverbien sind Verbindungen aus Adverb und Präposition (Präpo- 
sitionaladverbien u.ä.) wie da|durch, herjaus, wo|nach am auffälligsten - sie 
entsprechen nicht den typischen Komposita (zu diesen vgl. etwa Schlücker 
2012: 8 oder Ortner & Ortner 1984: 36) - nicht zuletzt, weil das rechts stehende 
Element nicht die Wortart der gesamten Wortbildung aufweist. Häufig sind 
außerdem Komposita aus zwei Adverbien wie wolher, darauf|hin, immer|hin. 
Zu weiteren relevanten lexikalischen Verbindungen, die übrigens ebenfalls 


59 Die Zusammenbildungen aus (Zahl-)Adjektiv, Substantiv und Suffix werden oft auch 
zu den Komposita gezählt (so bei Neef 2015: 584-585, anders bei Donalies 2002: 
95-96). Vor allem aber hätten Rektionskomposita auch der lexikalischen Verbindung 
zugeordnet werden können. 

60 Somit zeigen sie eine Bildungsweise, in der mehrere Wortbildungsschritte zu einem 
zusammengefasst werden. Sie hat eine größere Reichweite als bisher angenommen 
und wird im Kapitel „Wortbildungsarten“ ausführlicher behandelt. 

61 Hier sind auch Verbindungen mit Bindestrich(en) sehr zahlreich. 
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nicht den typischen Komposita entsprechen, gehören vor allem solche aus einer 
Präposition und einem Pronomen wie trotz|dem, unter|dessen, ohne|dies (unter 
ihnen sind auch Verbindungen mit einem komplexen Pronomen als Zweitglied 
zu finden wie in|einander, gegen|einander, mit|einander) und solche aus zwei 
Präpositionen wie vor|bei, in|zwischen, mit|unter. Die Ähnlichkeit der Substan- 
tive und der Adverbien hinsichtlich ihrer Prägung durch lexikalische Verbin- 
dungen entpuppt sich somit schnell als eine nur scheinbare. Die Positionierung 
der adverbialen Bildungen gegenüber den kanonischen, substantivischen Kom- 
posita wird ein wichtiger Punkt im Kapitel „Wortbildungsarten“ sein. Dem Auf- 
bau von Adverbien aus Lexemen unterschiedlicher Provenienz, bei dem neben 
der lexikalischen Verbindung auch die Suffigierung eine sehr wichtige Rolle 
spielt, widmet sich das Kapitel „Bau von und Umbau zu Adverbien“ (Brandt in 
dieser Ausgabe). 

Substantive und Adverbien haben darüber hinaus, was die Tokens angeht, 
einen ähnlichen Anteil an Suffigierungen, aber auch hier sind die Bildungen 
eigentlich grundsätzlich verschieden. Bei Substantiven dominieren die „klas- 
sischen“ Suffigierungen wie Erkldr|ung, Musik|er, Gewiss|heit, bei denen das 
komplexe Substantiv mithilfe eines spezialisierten Suffixes vor allem von einem 
Verb, sehr häufig aber auch von einem anderen Substantiv oder einem Adjek- 
tiv abgeleitet wird. Bei Adverbien kommen die Suffixe -s und -ens hingegen 
in Verbindung mit sehr vielfältigen Basen zum Einsatz (angesicht|s, bereit|s, 
zusehend|s, vergeben|s, erst|ens, höchst|ens). Die Verwendung von -s überlagert 
dann auch einen Teil der Bildungen mit suffixartigen desubstantivischen Zweit- 
gliedern wie andern |fallls, dies |seit|s, heim |wärt|s. Zu solchen Bildungen gehö- 
ren ansonsten auch etwa beispiels| weise, glücklicher|weise oder gleicher|maßen. 
Die sehr produktiven und theoretisch schwer einzuordnenden Adverbien mit 
desubstantivischen Zweitgliedern sind ebenfalls Gegenstand eines eigenen 
Kapitels. 

Im restlichen Teil ihrer Wortbildungsprofile sind sich Substantive und Adver- 
bien schon auf den ersten Blick unähnlich. Auffällig ist bei Substantiven ein 
merklicher Anteil an Konversionen im Bereich der Tokens ((das) Leben, (der) 
Anfang, (der) Auftritt), worin sie mit den Adjektiven und Verben vergleichbar 
erscheinen,” bei den Adverbien hingegen ein beträchtlicher Anteil an Bildun- 
gen, die nicht den etablierten Wortbildungsarten entsprechen wie schließ|lich, 
übrig|ens, zulnächst (in Abb. 7 dem „Rest“ zugeordnet) - einige von ihnen kön- 
nen als Univerbierungen betrachtet werden (seiner|zeit, zur|zeit, so|zu|sagen, 
vgl. Donalies 2018: 176-262). Präfigierungen sind bei Adverbien absolut 


62 Es ist aber nur eine Vergleichbarkeit hinsichtlich der Anteile und nicht in Bezug auf 
die Bildungsweisen. Letztere werden im Kapitel „Wortbildungsarten“ genauer darge- 
stellt. 
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randstandig,® bei Substantiven machen sie sich vor allem im Hinblick auf den 
Anteil der Tokens bemerkbar (Miss|erfolg, Un|menge, Ur|aufführung). 

Bei Adjektiven und Verben sind die lexikalischen Verbindungen anteilmä- 
Big schwächer ausgeprägt. Bei Adjektiven fallen vor allem die Verbindungen mit 
einem Substantiv als Erstglied ins Gewicht wie zahllreich, sinn |voll, welt| weit, in 
einem deutlichen Abstand gefolgt von den Verbindungen mit einem Adjektiv als 
Erstglied wie weit|gehend, offen|sichtlich, gleich|gültig. Bildungen beider Typen 
sind oft (wie die meisten lexikalischen Verbindungen bei den Substantiven) als 
typische Komposita zu betrachten. Unter den Verbindungen mit einem Adjektiv 
als Erstglied finden sich aber auch viele, die auch als Suffigierungen bzw. Zusam- 
menbildungen interpretiert werden könnten wie recht|zeitlig, volllständlig, 
frei|willlig. Bei Verben wiederum kommen spezielle morphosyntaktische Regu- 
laritäten zum Tragen. So machen sich hier die in Verbletztstellung befindlichen 
und daher zusammengeschriebenen Partikelverben besonders bemerkbar. Dabei 
fallen vor allem Verben mit depräpositionalen und deadverbialen Erstgliedern 
wie mit|teilen, fort|setzen, hin|weisen ins Gewicht, dann in einem größeren quan- 
titativen Abstand (mit absteigender Häufigkeit) solche mit einem deadjektivi- 
schen (bekannt|geben, sicher|stellen, offen|legen), desubstantivischen (statt |fin- 
den, gewährlleisten, teillhaben) und deverbalen (kennen|lernen, stehen|lassen, 
liegen| bleiben) Erstglied. 

Was die Verben im Gesamtvergleich auszeichnet, ist der besonders hohe 
Anteil an Präfigierungen. Es dominieren die Ableitungen eines Verbs aus einem 
anderen Verb wie er|klären, be|stehen, ent|scheiden. Quantitativ sehr deutlich 
nachgeordnet erscheinen Ableitungen mit einer desubstantivischen (be|fristen, 
ver|ursachen, ent|puppen) oder deadjektivischen Basis (be|treuen, er|ledigen, 
ver|öffentlichen). Bei den Adjektiven ist wiederum der Anteil der Suffigierung 
im Vergleich mit den drei anderen Wortarten am höchsten. Dabei erfolgt die 
Ableitung vor allem aus Substantiven wie in berufllich, beispiellhaft, witzlig, 
schon deutlich seltener aus Verben wie in deut|lich, denk|bar, abhänglig und 
noch seltener aus Adjektiven wie in kiirz|lich, stet|ig, gemein|sam. Auf die Ablei- 
tung aus Adjektiven folgen, was die Häufigkeit angeht, Zusammenbildungen 
wie gleich|zeit|ig, wahr|schein|lich, lang|frist|ig. Sie können als Ableitungen aus 
Adjektiv-Substantiv-Verbindungen interpretiert werden, welche nicht als Wör- 
ter (Komposita) etabliert sind (*Gleichzeit, *Wahrschein, “Langfrist). 

Adjektive weisen im Weiteren auch den im Vergleich der Wortarten höchsten 
Anteil an Konversionen auf, was vor allem darauf zurückgeht, dass hierzu die 
große Anzahl von adjektivisch gebrauchten Partizipien bzw. partizipbasierten 
Bildungen wie vergangen, entsprechend, bewusst gehört. Bei Verben ist der Anteil 


63 Zu Bildungen wie zu|tiefst als Präfigierungskandidaten vgl. Fleischer & Barz (2012: 
370) und das Kapitel „Bau von und Umbau zu Adverbien“. 
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Tabelle 3: Wortbildungsregeln beim Substantiv. 


Substantiv 


Wortbildungsart 


Typische Regeln 


Beispiel 


Lexikalische 1. SBST+SBST Wehrmachts]| ausstellung 
Verbindung 2. ADJ+SBST, V+SBST National|rat, Turn|halle 

3. PRAP+SBST Ab|glanz 

4. KONF+KONF, KONF+SBST Disko|thek, Atmo|sphäre 

5. ADV+SBST, [ADJ+SBST]+SBST | Auswärts|spiel, Lang|zeit|projekt 
Suffigierung 1. V+SUFF Besuchler 

2. SBST+SUFF Herr|schaft 

3. ADJ+SUFF Aufmerksam|keit 
Konversion 1. V > SBST Beginn 

2. ADJ — SBST Intellektuelle(r) 
Prafigierung 1, PRAF+SBST Un|glück 


2. PRÄF+V(+SUFF) 


Gelsang, Ge|bild|e 


der Konversionen wie landen, nutzen, sichern ebenfalls beachtlich, wobei sich vor 
allem bei Stämmen, die sowohl substantivisch als auch verbal gebraucht werden, 
zumindest synchron gesehen öfter die Frage der Konversionsrichtung stellt, z.B. 
Spiel < spielen oder spielen < Spiel (vgl. Eisenberg 2013: 284). Die Präfigierung ist 
bei Adjektiven (miss|mutig, un|schön, ur|alt) anteilmäßig etwa so schwach aus- 
geprägt wie die Suffigierung bei Verben. Letztere wird durch das Suffix -(is)ier- 
im Anschluss an fremde Basen dominiert. Gänzlich heimische Bildungen wie 
festligen, rein|igen, genehm|igen sind deutlich seltener. 

In den Tab. 3 bis 6 werden die für die vier Wortarten typischen Wortbildungs- 
regeln nach Wortbildungsarten geordnet gelistet und jeweils mit einem Beispiel- 
beleg veranschaulicht. Die häufigeren Wortbildungsarten und Regeln werden 
zuerst aufgeführt.“ Sind bestimmte Regeln innerhalb einer Wortbildungsart 
etwa gleich häufig, erscheinen sie in derselben Zeile. 


64 Bei den Häufigkeiten für Tokens und für Lemmata ergeben sich in der Regel gleiche 
Reihenfolgen wie schon weiter oben in der Abb. 6 für Wortbildungsarten. 
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Tabelle 4: Wortbildungsregeln beim Adjektiv. 


Adjektiv 
Wortbildungsart | Typische Regeln Beispiel 
Suffigierung 1. SBST+SUFF farblig 

2. V+SUFF bedenk|lich 

3. ADJ+SUFF eigent|lich 

4. ADV+SUFF heutlig 
Konversion 1. V — ADJ bestehend 

2. SBST — ADJ ernst 
Lexikalische 1. SBST+ADJ jahre|lang 
Verbindung 2. ADJ+ADJ halb|voll 

3. PRON+ADJ, ADV+AD} alllgegenwartig, wohl|bekannt 
Prafigierung 1. PRAF+ADJ in|direkt 

2. PRAF+[V+SUFF] un|ermüdllich 


Tabelle 5: Wortbildungsregeln beim Verb. 


Verb 
Wortbildungsart | Typische Regeln Beispiel 
Präfigierung T; PRÄF+V ver|treten 

2. PRAF+SBST be|flügeln 

3. PRAF+ADJ ent|schuldigen 
Konversion 1. SBST > V planen 

2. ADJ > V sichern 
Lexikalische 1, PRAP/ADV+V mit|teilen, fort|setzen 
Verbindung 2. ADJ+V fest|stellen 

3. SBST+V teil|nehmen 
Suffigierung 1. SBST+SUFF bilanzlieren 

2. ADJ+SUFF mobillisieren 


Tabelle 6: Wortbildungsregeln beim Adverb. 


Adverb 
Wortbildungsart | Typische Regeln Beispiel 
Lexikalische 1. ADV+PRÄP da|bei 
Verbindung 2. ADV+ADV wolanders 

3. PRAP+PRON zu|dem 

4. PRAP+PRAP zu|vor 
Suffigierung 1. ADJ+SUFF bereit|s 

2. [ADJ+SBST]+SUFF neuer|ding|s 

3. SBST+SUFF teil|s 

4. ADV+SUFF, AD} uper+ SUFF damal|s, mindest|ens 
Konversion 1. ADJsuper > ADV möglichst, längst 

2. SBST — ADV morgen 
Prafigierung ali PRÄF+AD] super zu|vorderst 


60 — Grundlegende Aspekte der Wortbildung 


ORCID® 
Marek Konopka ® https://orcid.org/0000-0001-9627-0918 


Literatur 


Baayen, Harald R. 2001. Word Frequency Distribution (Text, Speech and Language 
Technology 18). Dordrecht: Springer. 

Baayen, Harald R. 2009. Corpus linguistics in morphology: Morphological pro- 
ductivity. In Anke Lüdeling & Merja Kytö (Hgg.), Corpus Linguistics: An Inter- 
national Handbook (Handbücher zur Sprach- und Kommunikationswissen- 
schaft 29), Bd. 2, 899-919. Berlin: De Gruyter. 

Balnat, Vincent. 2011. Kurzwortbildung im Gegenwartsdeutschen (Germanistische 
Linguistik: Monographien 26). Hildesheim, New York & Zürich: Olms. 

Brandt, Patrick, Rolf-Albert Dietrich & Georg Schön. 2006. Sprachwissenschaft: 
Ein roter Faden für das Studium der deutschen Sprache, 2. Aufl. Köln: Böhlau. 

Bubenhofer, Noah, Selena Calleri & Philipp Dreesen. 2019. Politisierung in 
rechtspopulistischen Medien: Wortschatzanalyse und Word Embeddings. 
OBST. Osnabrücker Beiträge zur Sprachtheorie 95. 211-242. 

Deutsche Wortbildung ı = Kühnhold, Ingeburg & Hans Wellmann. 1973. Deut- 
sche Wortbildung: Erster Hauptteil: Das Verb (Sprache der Gegenwart 29). Düs- 
seldorf: Schwann. 

Deutsche Wortbildung 2 = Wellmann, Hans. 1975. Deutsche Wortbildung: Zweiter 
Hauptteil: Das Substantiv (Sprache der Gegenwart 32). Düsseldorf: Schwann. 

Deutsche Wortbildung 3 = Kühnhold, Ingeburg, Oskar Putzer & Hans Wellmann. 
1978. Deutsche Wortbildung: Dritter Hauptteil: Das Adjektiv (Sprache der 
Gegenwart 43). Düsseldorf: Schwann. 

Deutsche Wortbildung 4 = Ortner, Lorelies, Elgin Müller-Bollhagen, Hanspeter 
Ortner, Hans Wellmann, Maria Pümpel-Mader & Hildegard Gärtner. 1991. 
Deutsche Wortbildung: Vierter Hauptteil: Substantivkomposita (Sprache der 
Gegenwart 79). Berlin & New York: De Gruyter. 

Deutsche Wortbildung 5 = Pümpel-Mader, Maria, Elsbeth Gassner-Koch & Hans 
Wellmann. 1992. Deutsche Wortbildung: Fünfter Hauptteil: Adjektivkomposita 
und Partizipialbildungen (Sprache der Gegenwart 80). Berlin & New York: 
De Gruyter. 

Donalies, Elke. 2002. Die Wortbildung des Deutschen (Studien zur deutschen Spra- 
che 27). Tübingen: Narr. 

Donalies, Elke. 2009. Stiefliches Geofaszintainment: Über Konfixtheorien. In 
Peter O. Müller (Hg.), Studien zur Fremd wortbildung (Germanistische Lingu- 
istik 197-198), 41-64. Hildesheim, New York, Zürich: Olms. 


Literatur — 61 


Donalies, Elke. 2018. Wetterbeobachter, Zeitlang, wahrsagen, zartfühlend, kurzer- 
hand, dergestalt: Handbuch zur Univerbierung. Heidelberg: Winter. 

Dudengrammatik. 2016 = Wöllstein, Angelika & Dudenredaktion (Hgg.). 2016. 
Dudenband 4 - Die Grammatik, 9. Aufl. Berlin: Dudenverlag. 

DWB = Grimm, Jacob & Wilhelm Grimm. 1854-1961. Deutsches Wörterbuch von 
Jacob und Wilhelm Grimm. 16 Bände in 32 Teilbänden. Quellenverzeichnis 
1971. Leipzig: Hirzel. http://woerterbuchnetz.de/cgi-bin/WBNetz/wbgui_py? 
sigle=DWB (abgerufen am 6.6.2020). 

Eichinger, Ludwig M. 2000. Deutsche Wortbildung: Eine Einführung. Tübingen: 
Narr. 

Eisenberg, Peter. 2013. Grundriss der deutschen Grammatik. Bd. ı: Das Wort, 
4. Aufl. Stuttgart & Weimar: Metzler. 

Evert, Stefan & Marco Baroni. 2005. Testing the extrapolation quality of word 
frequency models. In Pernilla Danielsson & Martijn Wagenmakers (Hgg.), 
Proceedings from the Corpus Linguistics Conference Series, Bd. ı. Birmingham: 
University of Birmingham.  https://www.birmingham.ac.uk/Documents/ 
college-artslaw/corpus/conference-archives/2005-journal/Lexiconodf/ 
EvertBaroni2005.pdf (abgerufen am 7.7.2020). 

Evert, Stefan & Marco Baroni. 2007. zipfR: Wordfrequency distributions in R. 
In Sophia Ananiadou (Hg.), Proceedings of the 45th Annual Meeting of the 
Association for Computational Linguistics Companion Volume Proceedings of 
the Demo and Poster Sessions. 29-32. Prag: ACL. https://www.aclweb.org/ 
anthology/Po7-2008.pdf (abgerufen am 7.7.2020). 

Evert, Stefan & Anke Lüdeling. 2001. Measuring morphological productivity: Is 
automatic preprocessing sufficient? In Paul Rayson, Andrew Wilson, Tony 
McEnery, Andrew Hardie & Shereen Khoja (Hgg.), Proceedings of the Corpus 
Linguistics 2001 conference, 167-175. Lancaster: UCREL. 

Finkel, Jenny Rose, Trond Grenager & Christopher Manning. 2005. Incorpo- 
rating non-local information into information extraction systems by Gibbs 
sampling. In Kevin Knight, Hwee Tou Ng & Kemal Oflazer (Hgg.), Proceed- 
ings of the 43rd Annual Meeting of the Association for Computational Linguis- 
tics (ACL’05), 363-370. Ann Arbor: Association for Computational Linguis- 
tics. http://nlp.stanford.edu/~manning/papers/gibbscrf3.pdf (abgerufen am 
18.7.2020). 

Fleischer, Wolfgang & Irmhild Barz. 2012. Wortbildung der deutschen Gegenwarts- 
sprache, 4. Aufl. Berlin & Boston: De Gruyter. 

Gallmann, Peter. 1999. Fugenmorpheme als Nicht-Kasus-Suffixe. In Matthias 
Butt & Nanna Fuhrhop (Hgg.), Variation und Stabilität in der Wortstruktur 
(Germanistische Linguistik 141-142), 177-190. Hildesheim, New York & 
Zürich: Olms. 

Grimm, Jakob. 1826. Deutsche Grammatik. Bd. 2. Gottingen: Dietrich. 


62 — Grundlegende Aspekte der Wortbildung 


Haß, Ulrike & Klosa, Annette (2015): elexiko - Geschichte und Zukunft. Sprach- 
report 3. 10-20. 

HDK ı = Pasch, Renate, Ursula Brauße, Eva Breindl & Ulrich H. Waßner. 2003. 
Handbuch der deutschen Konnektoren: Linguistische Grundlagen der Beschrei- 
bung und syntaktische Merkmale der deutschen Satzverknüpfer (Konjunktion, 
Satzadverbien und Partikeln) (Schriften des Instituts für deutsche Sprache 9). 
Berlin & New York: De Gruyter. 

Henzen, Walter. 1965. Deutsche Wortbildung, 3. Aufl. Tübingen: Niemeyer. 

Kopf, Kristin. 2018. Fugenelemente diachron: Eine Korpusuntersuchung zu Ent- 
stehung und Ausbreitung der verfugenden N+N-Komposita (Studia linguistica 
Germanica 133). Berlin & Boston: De Gruyter. 

Leser, Martin. 1990. Das Problem der ‚Zusammenbildungen‘: eine lexikalistische 
Studie (Fokus 3). Trier: WVT. 

Meibauer, Jörg, Ulrike Demske, Jochen Geilfuß-Wolfgang, Jürgen Pafel, Karl 
Heinz Ramers, Monika Rothweiler & Markus Steinbach. 2007. Einführung in 
die germanistische Linguistik, 2. Aufl. Stuttgart & Weimar: Metzler. 

Motsch, Wolfgang. 1999. Deutsche Wortbildung in Grundzügen (Schriften des Ins- 
tituts für deutsche Sprache 8). Berlin & New York: De Gruyter. 

Neef, Martin. 2015. Synthetic compounds in German. In Peter O. Müller, Inge- 
borg Ohnheiser, Susan Olsen & Franz Rainer (Hgg.), Word-Formation: An 
International Handbook of the Languages of Europe (Handbücher zur Sprach- 
und Kommunikationswissenschaft 40), Bd. 1, 581-592. Berlin: De Gruyter. 

Nübling, Damaris, Antje Dammel, Janet Duke & Renata Szczepaniak. 2017. Histo- 
rische Sprachwissenschaft des Deutschen: Eine Einführung in die Prinzipien des 
Sprachwandels, 5. Aufl. Tübingen: Narr. 

Nibling, Damaris & Renata Szczepaniak. 2009. Religion+s+freiheit, 
Stabilität+s+pakt und Subjekt(+s+)pronomen: Fugenelemente als Marker pho- 
nologischer Wortgrenzen. In Peter O. Müller (Hg.), Studien zur Fremdwortbil- 
dung (Germanistische Linguistik 197-198), 197-222. Hildesheim, New York 
& Zürich: Olms. 

Ortner, Hanspeter & Lorelies Ortner. 1984. Zur Theorie und Praxis der Komposita- 
forschung (Forschungsberichte des Instituts für deutsche Sprache 55). Tübin- 
gen: Narr. 

Paul, Hermann. 1920. Deutsche Grammatik. Bd. 5: Wortbildungslehre. Halle a. S.: 
Niemeyer. 

Pfeifer, Wolfgang (Hg.). 1993-heute. Etymologisches Wörterbuch des Deutschen.: 
Digitalisierte und v. Wolfgang Pfeifer überarbeitete Version im Digitalen Wör- 
terbuch der deutschen Sprache. Bearbeitet von Wilhelm Braun, Gunhild 
Ginschel, Gustav Hagen, Anna Huber, Klaus Müller, Heinrich Petermann, 
Gerlinde Pfeifer, Dorothee Schröter & Ulrich Schröter. https://www.dwds. 
de/d/wb-etymwb (abgerufen am 8.5.2020). 


Literatur — 63 


Roth, Tobias. 2014. Wortverbindungen und Verbindungen von Wörtern: Lexikogra- 
fische und distributionelle Aspekte kombinatorischer Begriffsbildung zwischen 
Syntax und Morphologie (Basler Studien zur deutschen Sprache und Litera- 
tur). Tübingen: Francke. 

Schäfer, Roland. 2015. Processing and Querying Large Web Corpora with the 
COW 14 Architecture. In Piotr Banski, Hanno Biber, Evelyn Breiteneder, Marc 
Kupietz, Harald Lüngen, & Andreas Witt (Hgg.), Proceedings of Challenges in 
the Management of Large Corpora (CMLC-3), 28-34. Mannheim: Institut für 
Deutsche Sprache. 

Schäfer, Roland & Felix Bildhauer. 2012. Building Large Corpora from the Web Using 
a New Efficient Tool Chain. In Nicoletta Calzolari, Khalid Choukri, Thierry 
Declerck, Mehmet Ugur Dogan, Bente Maegaard, Joseph Mariani, Asuncion 
Moreno, Jan Odijk & Stelios Piperidis (Hgg.), Proceedings of the Eightth Inter- 
national Conference on Language Resources and Evaluation (LREC’12), 486-493. 
Istanbul: European Language Resources Association (ELRA). 

Schlücker, Barbara. 2012. Die deutsche Kompositionsfreudigkeit: Übersicht 
und Einführung. In Livio Gaeta & Barbara Schlücker (Hgg.), Das Deutsche 
als kompositionsfreudige Sprache: Strukturelle Eigenschaften und systembezo- 
gene Aspekte (Linguistik - Impulse & Tendenzen 46), 1-25. Berlin & Boston: 
De Gruyter. 

Schmid, Helmut. 1995. Improvements in Part-of-Speech Tagging with an Appli- 
cation to German. Proceedings of the ACL SIGDAT-Workshop. Dublin (Irland). 
http://www.cis.uni-muenchen.de/-schmid/tools/TreeTagger/data/tree- 
tagger2.pdf (abgerufen am 9.2.2020). 

Schmid, Helmut, Arne Fitschen & Ulrich Heid. 2004. SMOR: A German Compu- 
tational Morphology Covering Derivation, Composition, and Inflection. In 
Maria Teresa Lino, Maria Francisca Xavier, Fätima Ferreira, Rute Costa & 
Raquel Silva (Hgg.), Proceedings ofthe Fourth International Conference on Lan- 
guage Resources and Evaluation (LREC’o4), 1263-1266. Lissabon: European 
Language Resources Association (ELRA). https://www.cis.uni-muenchen. 
de/-schmid/papers/smor.pdf (abgerufen am 18.6.2020). 

Waßner, Ulrich H. 2002. Geschlossene Klassen? In Reinhard Rapp (Hg.), Sprach- 
wissenschaft auf dem Weg in das dritte Jahrtausend: Akten des 34. Linguis- 
tischen Kolloquiums in Germersheim 1999. Teil II: Sprache, Computer, Gesell- 
schaft, 635-643. Frankfurt a. M., Berlin, Bern u.a.: Lang. 

Willems, Klaas. 2013. Funktionswort. In Stefan J. Schierholz & Päl Uzonyi (Hgg.), 
Grammatik: Formlehre: Wörterbücher zur Sprach- und Kommunikationswissen- 
schaft (WSK) Online. Berlin & Boston: De Gruyter. https://db.degruyter.com/ 
view/WSK/wsk_id_wsk_artikel_artikel_21552 (abgerufen am 18.6.2020). 

Wilmanns, Wilhelm. 1899. Deutsche Grammatik: Gotisch, Alt-, Mittel- und Neu- 
hochdeutsch. Straßburg: Trübner. 


Patrick Brandt 


Bau von und Umbau zu Adverbien: 
Präpositionen, Vergleiche und Flexion 


Abstract This chapter focuses on the formation of adverbs from a corpuslinguis- 
tic perspective, providing an overview of adverb formation patterns in German 
that includes frequencies and hints to productivity as well as combining quan- 
titative methods and theoretically founded hypotheses to address questions that 
concern possible grammaticalization paths in domains that are formally marked 
by prepositional elements or inflectional morphology (in particular, superlative or 
superlative-derived forms). Within our collection of adverb types from the project 
corpus, special attention is paid to adverbs built from primary prepositions. The 
data suggest that generally, such adverb formation involves the saturation of the 
internal argument slot of the relation-denoting preposition. In morphologically 
regular formations with the preposition in final position, pronominal forms like 
da ‘there’, hier ‘here’, wo ‘where’ as well as hin ‘hither’ and her ‘thither’ serve to 


derive adverbs. On the other hand, morphologically irregular formations with 
the preposition - in particular: zu ‘to’ or vor ‘before, in front of’ - in initial posi- 
tion show traits of syntactic origin such as (remnants of) inflectional morphology. 
The pertaining adverb type dominantly saturates the internal argument slot by 
means of universal quantification that is part and parcel as well of the derivation 
of superlatives and demonstrably fuels the productivity of the pertaining forma- 


tion pattern. 


Keywords adverb formation, argument saturation, inflection, primary preposi- 


tion, superlative, zero derivation 


1 Ausgangspunkt und Ziel 


Ziel des vorliegenden Kapitels ist es, ausgehend von tatsächlich vorkommenden 


Sprachdaten mittels Korpusanalyse Verfahren in der Wortbildung zu erhellen, 


die den adverbialen Gebrauch von Wörtern und damit so etwas wie die Wortart 


Adverb bestimmen. Vor dem Hintergrund gängiger Annahmen über argument- 


strukturelle Repräsentationen zeigt der korpuslinguistische Zugang zahlreiche 
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Zusammenhänge von Form und Funktion (Bedeutung) auf, die in der bisherigen 
Forschung nur am Rande oder gar nicht behandelt worden sind. 

Gegenstand der Betrachtung ist zunächst eine Liste von Wörtern aus einem 
Teil des Deutschen Referenzkorpus (DeReKo), die der TreeTagger als Adverb 
erkennt. Die formbasierte Ordnung und quantitative Auswertung der so erhal- 
tenen Lemmata zielt einerseits auf eine empirisch fundierte Typologie der ver- 
schiedenen Bildungsweisen von Adverbien. Andererseits geben die vorgefunde- 
nen quantitativen und qualitativen Bezüge und Eigenschaften Anlass zu einer 
genaueren Sichtung, Erhebung und Analyse von sekundären Adverbien, die 
bestimmte Formelemente enthalten; dabei handelt es sich um präpositionale For- 
men, die den 20 primären (oder „alten“) Präpositionen des Deutschen entspre- 
chen sowie um Formen aus dem Flexionsinventar des Deutschen, die als solche 
oder miteinander kombiniert interessante synchrone oder diachrone Bezüge zu 
den präpositionalen Formen oder sie als Kern enthaltenden syntaktischen Kon- 
struktionen aufweisen. Die Natur dieser Bezüge veranlasst uns, zwischen wort- 
bildungsregelgerechtem „Bau von“ und auf syntaktische Quellen rekurrieren- 
den „Umbau zu“ Adverbien zu unterscheiden und liefert Hinweise auf mögliche 
Grammatikalisierungspfade im betrachteten Bereich. 


1.1 Formale und funktionale Bestimmung der Wortart 


Wie keine andere Wortart ist das Adverb funktional bestimmt: Gängigen Auf- 
fassungen zufolge sind Adverbien Wörter, die adverbial gebraucht werden (z.B. 
Helbig & Buscha 2001:306, Meibauer et al. 2007: 132). Anhand der ausführliche- 
ren, auf Gebrauchsmöglichkeiten basierenden Charakterisierung von Schmöe 
(2002: 159) und Schäfer (2013: 19), die in der folgenden Liste (1. bis 4.) zusam- 
mengefasst wird, soll hier die mit der Kategorisierung als Adverb verbundene 
Problematik skizziert und ein Ausblick auf das Kommende gegeben werden:* 
Adverbien werden nicht flektiert. 


m 


Adverbien können als Satzglied fungieren. 
Adverbien sind einzelne Wörter. 


ID 


Adverbien können nicht als Subjekt fungieren. 


1 Fur oder gegen die Notwendigkeit der Unterscheidung von Lexemen (vs. Morphemen), 
möglichen (vs. tatsächlichen) Gebräuchen, lexikalischen (vs. syntaktischen) Wörtern 
oder bzgl. ihrer Wortartenzugehörigkeit unbestimmten Wurzeln und damit verbun- 
den einer mehr oder weniger direkten Verbindung zwischen Laut- und Bedeutungs- 
strukturen wird hier nicht vorrangig argumentiert. Vgl. dazu Aronoff (1994: xiii), 9, 
Dudengrammatik (2009: 132-134), Halle & Marantz (1993) sowie unten Abschnitt 5.4. 
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Bezüglich ı werden wir feststellen, dass Adverbien häufig kompariert werden 
bzw. komparierten Formen von Adjektiven entsprechen; insbesondere Superlati- 
vierung trägt offenbar zur Brauchbarkeit als Adverb bei (vgl. Abschnitt 5). Dar- 
über hinaus enden zahlreiche Adverbien in Formen, die auch in der Flexion des 
Deutschen vorkommen (insbesondere: -e, -en, -s, -st und Kombinationen dersel- 
ben wie -stens, s. Abschnitt 3.1 und 5.3), was eine wenigstens historisch gegebene 
Flektierbarkeit vorauszusetzen scheint. Das funktionale Kriterium 2 markiert die 
Grenze zwischen Adverb und Partikel und anderen in der Regel nicht selbststän- 
dig auftretenden Elementen wie Präpositionen; tatsächlich ist diese Grenze für 
viele Elemente in diesem Bereich nicht klar zu ziehen (vgl. Abschnitt 4). Krite- 
rium 3 ist bezüglich sogenannter Zusammenrückungen (auch: Univerbierungen) 
problematisch; zum einen handelt es sich dabei um lexikalisierte Relikte mehr 
oder weniger direkt aus der Syntax übernommener, zu Wörtern umgebauter 
phrasaler Einheiten wie z.B. vonnöten, imstande, die auch flexivische Elemente 
beinhalten können (vgl. wiederum Kriterium 1); zum anderen sind Zusammen- 
rückungen im Bereich superlativischer Bildungen, wie wir zeigen werden, auch 
synchron produktiv (Abschnitt 5.2). Das wiederum funktionale Kriterium 4 
ist im Fall lokaler und temporaler Adverbien problematisch, die wenigstens in 
kopulativen Konstruktionen als Subjekte erscheinen können:? 


(1) Vorn ist da, wo die Chinesen sind. (Berliner Zeitung, 22.3.2006, S. 16) 


1.2 Adverbial gebrauchte Adjektive oder Adjektivadverbien 


Die Abgrenzung von Adjektiven und Adverbien wirft grundlegende Probleme 
für die Wortartenklassifizierung auf (vgl. Telschow 2014). Entscheidend ist 
die Frage, ob Adjektive unter flexionslosem, weder attributivem noch prädi- 
kativem und mithin adverbialem Gebrauch zu Adverbien werden und also die 
Rede von „Adjektivadverbien“ rechtfertigen wie bei Helbig & Buscha (2001: 
280, 306). Weiter verbreitet erscheint die Auffassung, dass Adjektive unter 


2 Direktionale Ausdrücke spreizen die Grenze zwischen Argument und Adverbial. 
(i) illustriert Variation zwischen einer direktionalen Präpositionalphrase mit Akkusa- 
tiv und einem Dativobjekt. 

(i) a. Sie könnten die Schüler direkt an die Mittelschule zuweisen. (Die Südost- 
schweiz, 12.8.2010, 0. S.) 
b. Sie habe den Jungen der Grundschule zugewiesen; dies sei für die Stadt 
Koblenz bindend. (Rhein-Zeitung, 27.8.2003, o. S.) 
Im Englischen sind direktionale Präpositionalphrasen neben nominativischen Nomi- 
nalphrasen die einzigen Konstituenten, die unter Lokativinversion die Position vor 
dem finiten Verb besetzen können, vgl. z.B. Bresnan (1994). 
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adverbialer Verwendung ihre Kategorie bewahren; es ist dann die Rede von 
„adverbial gebrauchten Adjektiven“ (z.B. Heidolph et al. 1981: 621-622, Eisen- 
berg 2013: 227-228). Zur Annahme eines Wortartenwechsels passt die Annahme 
von Konversion, d.h., der Null-Ableitung von Adverbien aus Adjektiven. Inter- 
essant ist in diesem Zusammenhang, dass offenbar nur graduierbare und stei- 
gerbare Adjektive wie z.B. schnell oder schön als Adverbiale fungieren, nicht 
aber sogenannte absolute Adjektive wie z.B. rund oder lebendig, die nicht ohne 
Weiteres steigerbar sind.” Die Bedingungen für Steigerbarkeit einerseits und 
Adverbierbarkeit andererseits haben also etwas miteinander zu tun. Graduier- 
bare Eigenschaften taugen bei ansonsten geeigneter Semantik ohne Weiteres 
für adverbialen Gebrauch, d.h. solchen, der das bezeichnete Geschehen (s.u. 
Abschnitt 1.3) modifiziert (Gianna läuft schnell).* Der nicht-attributive Gebrauch 
absoluter Adjektive ist hingegen in aller Regel prädikativ, d.h., es wird nicht die 
Art und Weise eines Geschehens modifiziert, sondern es wird einem der Argu- 
mente eine Eigenschaft zugesprochen: 


(2) Diese Tiere gehen lebendig in die entsprechenden Brühbehälter. 
‚Diese Tiere sind lebendig, wenn sie in die Brühbehälter gehen‘ 
(Protokoll der Sitzung des Parlaments Deutscher Bundestag, 29.6.2012, 
o. S.) 


Sofern absolute Adjektive doch adverbial verwendet werden, handelt es sich um 
metaphorischen Gebrauch:* 


(3) Ein Schulmuseum im Eifeldörfchen Immerath (be-)schreibt lebendig 
Geschichte. 
Nicht: ‚Ein Schulmuseum im Eifeldörfchen Immerath ist lebendig, wenn es 
Geschichte (be-)schreibt.‘ (Rhein-Zeitung, 12.7.1997, o. S.) 


3 Mit Eisenberg (2013: 228) bezeichnet ein „Prototyp“ von Adjektiv „einfache“ Eigen- 
schaften von Dingen; dieser ist „in seiner Grundbedeutung attributiv und prädikativ, 
nicht aber adverbial verwendbar [...].“ 

4 Über zugrundeliegende Relationalitat hinaus spielt z.B. die Unterscheidung zwischen 
„stage-level“ und „individual-level“-Prädikaten eine Rolle (Milsark 1974, Carlson 
1977), indem nur raumzeitlich kontingente (also „stage-level“) Prädikate sinnvoll auf 
Geschehen applizieren. 

5 Vgl. wiederum Eisenbergs (2013: 228) Beispiele für die metaphorisch verschobene 
Interpretation einfacher Adjektive unter adverbialem Gebrauch: 

(i) a. Der Motor läuft rund. 
b. Karl denkt grün. 
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Aussage 
Subjekt, Prädikat 

AGENS 

KOMPARANDUM R<x,y> Objekt, 

Gianna spielt 

ist.schnell(er) PATENS 

VERGLEICHSSTANDARD 
Klavier 
wie/als ein Pfeil 


Abbildung 1: Externe und interne Argumente einer Relation. 


Absolute Adjektive bezeichnen Eigenschaften von Individuen, während gradu- 
ierbare Adjektive Individuen auf der durch sie induzierten Skala in Beziehung 
zu einem VERGLEICHSSTANDARD setzen. Graduierbare Adjektive sind damit fun- 
damental relational; sie teilen ihre logische Form mit zweistelligen Verben, die 
einem universellen semantischen Prinzip unterliegen: Sofern in der Beziehung 
ein AGENS- und ein PATIENS-Argument aufeinander bezogen werden, wird ers- 
teres als grammatisches Subjekt und letzteres als grammatisches Objekt reali- 
siert.‘e Mit Blick auf die zugrundeliegende Konstituentenstruktur folgen wir 
hier der Sprechweise von relativ zum Prädikat „externen“ (AGENs, Subjekt) und 
„internen“ (PATIENS, Objekt) Argumenten. VERGLEICHSSTANDARDS verhalten 
sich analog zu (internen) Patiens-Argumenten, die in ihr Prädikat inkorporie- 
ren (Gianna ist pfeilschnell bzw. Gianna darf klavierspielen) oder unausgedrückt 
bleiben können, im Gegensatz zu KOMPARANDA oder AGENS-Argumenten, die 
aufgrund ihrer Externalität syntaktisch durch Prädikation lizenziert werden 
müssen. Die Baumstruktur in Abb. ı veranschaulicht die externe (als Subjekt) vs. 
interne (als Objekt) Realisierung der genannten thematischen Bausteine relativ 
zum Prädikat. 

Wir nehmen zusammenfassend an, dass geschehensbezogenen Adverbien 
relationale Einheiten zugrundeliegen, die im Fall von Verben bzw. Adjektiven ein 


6 Wir verstehen unter AGENs den belebten Verursacher einer Handlung und unter 
PATIENS eine von der Handlung betroffene und in der Regel durch sie veränderte 
Entität (vgl. Primus 1999). 
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AGENS- bzw. KOMPARANDUM-Argument und ein PATIENS bzw. VERGLEICHSSTAN- 
DARD-Argument in Beziehung zueinander setzen. Allgemeineren grammatischen 
Prinzipien folgend werden diese strukturell extern (als Subjekt) bzw. intern (als 
Objekt) realisiert. Einen roten Faden für die vorliegende Untersuchung bildet 
der für die Herstellung von Adverbien wesentliche Umbau von Relationen zu 
Eigenschaften: Die Sättigung der internen Argumentstelle des relationalen Aus- 
drucks (einer Funktion von Paaren von Individuen in Wahrheitswerte) bringt 
ein einstelliges Prädikat, d.h. eine Eigenschaft (eine Funktion von Individuen in 
Wahrheitswerte) hervor, die dann von einem Geschehen (s.u. Abschnitt 1.3) pra- 
diziert werden kann. Wie wir sehen werden, kommen als relationale Einheiten 
über Verben und Adjektive hinaus vor allem Präpositionen in Frage.” 


1.3 Externe und interne Rollen: Partizipien 


Die Relevanz der Unterscheidung zwischen extern und intern realisierten 
semantischen Rollen für den Bau von Adverbien wird bei der vergleichenden 
Betrachtung von Partizipien I versus Partizipien II deutlich. Beide Typen können 
wie Adjektive gebraucht werden, wobei sie bei zugrundeliegenden transitiven 
Verben eindeutig auf semantische Rollen bezogen sind: Partizipien I beziehen 
sich auf das AGENs (externe Rolle, 4a) und Partizipien II auf das PATIENs (interne 
Rolle, 4b). 


(4) a. Ebernburg spielte enttäuschend. (Rhein-Zeitung, 21.2.2000, o. S.) 
b. Berlins Mineiro (Nr. 7) dreht enttäuscht ab. (Berliner Zeitung, 
29.1.2008, 0. S.) 


In (4a) enttäuscht Ebernburg (AcENs bzw. Subjekt, externe Rolle), es bleibt 
unausgedrückt, wer enttäuscht wird (PATIEns bzw. Objekt, interne Rolle). In (4b) 
ist bzw. wurde Mineiro enttäuscht (PATIENS bzw. Objekt, interne Rolle), wer oder 
was ihn enttäuscht, bleibt unausgedrückt (AGENS bzw. Subjekt, externe Rolle). 
Partizipien I können ohne Weiteres adverbial gebraucht werden, Partizipien II 
nicht. 

Im Anschluss an Davidson (1967) bestimmen wir Adverbien - unter Aus- 
klammerung satzkommentierender Adverbien wie leider oder erfreulicher- 
weise — als Ausdrücke für Eigenschaften von Geschehen. Propositionen kön- 
nen wahr oder falsch sein, Geschehen dagegen „haben statt“, „passieren“, 


7 Die hier im Fokus stehenden sogenannten primären Präpositionen realisieren in ihrer 
lokativen Funktion das Locandum-Argument extern und das Locatum-Argument 
intern (vgl. die Abschnitte 3.2 und 4.1). 


2 Korpus, Suchanfragen und Methoden — 71 


„verlaufen“ oder „ereignen sich“. Davidson spricht von „action sentences“ und 
hat damit offenbar vor allem spezifisch durch AGENs-Argumente verursachte 
Geschehen im Sinn. Die Paraphrase von (4a) in (5) bringt die Nähe zwischen 
AGENS-Argumenten und den durch sie in Gang gebrachten Geschehen heraus; 
eine solche Paraphrase steht für (4b) nicht zur Verfügung. Vielmehr ist das ent- 
täuschende Geschehen, dessen PATIENS Mineiro ist, gar nicht Teil des proposi- 
tionalen Gehalts von (4b), sondern z.B. in einem vorhergehenden Satz kodiert 
oder irgendwie inferierbar. 


(5) Es gibt ein Spielgeschehen e, das AGENS von e ist Ebernburg und Ebern- 
burgs Agieren ist enttäuschend. 


Partizipien liefern Hinweise darauf, dass AGENs-orientierte Prädikate sich 
unter Unterschlagung des PATIENS-Arguments ohne Weiteres in Eigenschaften 
von (agentivischen) Geschehen umbauen und mithin als Adverbien gebrau- 
chen lassen; Adverbien sind also verwandt mit AGEns-orientierten Prädikaten. 
Umgekehrt gibt es keinen unmarkierten Weg, PATIENS-orientierte Prädikate 
unter eventueller Unterschlagung des AGENs-Arguments in Eigenschaften von 
Geschehen umzubauen und mithin als Adverbien zu gebrauchen. 


2 Korpus, Suchanfragen und Methoden 


Aus einem Achtel des Untersuchungskorpus (ca. 900 Mio. Tokens) wurden 
sämtliche als Adverb getaggten Wortformen extrahiert (TreeTagger, STTS). Der 
so gewonnene Datensatz ADVERBIEN_1 enthält 3.753 unterschiedliche Typen 
(Lemmata) mit über 40 Mio. Tokens.* Die Daten wurden nachträglich nach Suf- 
fix (29 Klassen) und Bauform (primäre, flexivische, präpositionale und suffixale 


8 Eine formbasierte oder negativ taggingbasierte Extraktion mit dem Ziel einer höheren 
Quote der berücksichtigten Adverbien aus der Gesamtheit aller tatsächlichen Adver- 
bien im Korpus ist aufgrund der Abwesenheit des Ausdrucks umgebungsabhängiger 
morphosyntaktischer Merkmale an Adverbien (z.B., Kongruenz) bei der gleichzei- 
tigen Vielfalt einzelner Adverbmarker und gegebenenfalls deren Multifunktionali- 
tät (z.B. des -s oder -en) hier nicht darstellbar. Im Bereich der genauer betrachteten 
präpositionalen und flexivischen Formen wurden ergänzende formbasierte Suchen 
durchgeführt und die Typen händisch auch hinsichtlich ihrer Konstituentenstruktur 
überprüft; durch den Herausfall von Formen, deren Letztglied bereits ein Adverb ist 
(z.B. geradeheraus) reduzierte sich die Zahl der Typen dabei nur leicht (um jeweils 3 
bei den Typen mit Präpositionen als Letztglied bzw. Erstglied). Schreibvarianten (z.B. 
-ermaßen vs. -ermassen) sowie offensichtliche Fehlschreibungen wurden nach Mög- 
lichkeit zusammengefasst bzw. aussortiert, allerdings nicht in der großen Gruppe der 
mal-Typen, in der Schreibungen und Frequenzen stark variieren. 
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Typen) annotiert, womit sich 94% des Bestandes erfassen ließen (zum Überblick 
s. Tab. 1). Nicht kategorisiert wurden z.B. Adverbien, deren Letztglied ein freies 
Morphem ist (z.B. kurzerhand, nunmehr, gleichwohl), konvertierte Formen wie 
gemach oder getrost, Lehnwörter (z.B. brutto, unisono, offshore) sowie Abkürzun- 
gen (z.B., ca., evtl.). 

Für eine Detailstudie (Abschnitt 3.3) wurden außerdem im selben Korpusach- 
tel wortformbasiert sämtliche Bildungen auf -erweise und -ermaßen extrahiert, 
sie bilden den Datensatz ADVERBIEN_2. Grund für den Verzicht auf das Tagging 
war der bessere Recall, d.h., eine höhere Quote der aus allen tatsächlich validen 
Belegen korrekt als solchen erkannten Belegen: Die Zahl der Typen steigt ver- 
glichen mit den taggingbasierten Zahlen bei Bildungen mit -erweise von 756 auf 
873 an, bei Bildungen mit -ermaßen von 67 auf 77; die Zahl der Hapaxlegomena 
steigt auf 405 (von 308) bei -erweise und auf 30 (von 22) bei -ermaßen. 


3 Beschränkt heterogene Bildungsweisen 


Tabelle 1 zeigt die Verteilung der Formen nach ihrer Bildungsweise.’ Wir unter- 
scheiden neben tendenziell primären Wörtern, die mit 64 Typen etwa 2% des 
Bestands ausmachen, drei übergeordnete, zum Teil aufeinander bezogene sekun- 
däre Bauformen: 
„Flexivische“ Typen, die auf in der Flexion des Deutschen vorkommende For- 
mative enden (287 oder 8% der Typen insgesamt).”° 


9 Umbei Schreibungen wie <1.>, <2.>, ... <174.> den wahrscheinlichen Anteil an aus Ordi- 
nalzahlen abgeleiteten Adverbien (erstens, zweitens, hundertvierundsiebzigstens) zu 
ermitteln, wurde eine Stichprobe von 250 Belegen genommen und hochgerechnet. 
Insgesamt gibt es im Korpus 1024 solcher Schreibungen (davon 100 Hapaxlegomena), 
die mit einer durchschnittlichen Tokenzahl von 208,9 insgesamt 213.905 Tokens lie- 
fern. Die manuelle Auszählung ergibt, dass 6,4% davon Ordinalzahlen, also stens-Falle 
sind. Extrapoliert ergeben sich 66 zusätzliche stens-Typen, 13.787 zusätzliche Tokens 
und sechs zusätzliche Hapaxlegomena (jeweils gekennzeichnet mit einem Plus- 
Zeichen). 

10 Die in Frage stehenden Formen haben wohl eine ehemalige flexionsbezogene Funk- 
tion verloren (z.B.: Anzeige von Abhängigkeit durch Kasus durch -e oder -en). Das 
heißt m.E. jedoch nicht, dass die in Frage stehenden Elemente im eigentlichen Sinne 
funktionslos sind, denn sie markieren ja qua Argument (wiewohl möglicherweise 
unter anderem) Adverbien. Die eindeutig Adverbien markierende und synchron pro- 
duktive -stens Form (z.B.: hundertsiebenundachtzigstens, hundertachtundachtzigstens, 
allerallerschnellstens ...) hat regulär elativische, also eindeutig semantische Funktion 
(vgl. jedoch Abschnitt 5.2). Die Diskussion in Abschnitt 5 deutet darauf hin, dass die 
Komparation und insbesondere Superlativierung markierenden Formen als solche 
Adverbierung begünstigen und also auch in diesem (neuen) Sinne funktional sind. 
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Tabelle 1: Bauformen, Typen, Tokens, Hapaxlegomena und TTRs (Type-Token-Verhält- 
nisse). 


Typen Tokens Hapaxlegomena | TTRx10% 

primär 64 | 26.652.241 0 2 
flexivisch -stens 60 287.606 6 209 
+ 66 + 13.787 +6 418 

-S 74 1.670.678 10 44 

-en 49 396.643 2 124 

-st 33 1.086.391 4 30 

-ens 5 58.883 0 85 

-e 31 486786 2 64 

präpositional | -präp 244 1.052.093 23 232 
präp- 181 2.423.535 7 75 

suffixal -mal 1.201 726.604 609 1.653 
-erweise 756 111.320 308 6.791 

-wärts 251 32.093 109 7.821 

-seits 158 88.066 78 1.794 

-ermaßen 67 33.102 22 2.024 

-hin 49 330.930 7 148 

-tags 34 109.977 0 318 

-lich 38 1.203.809 0 32 

-her 33 411.661 4 80 

-weise 28 180.371 0 155 

-falls 27 312.041 6 87 

-wegs/en 22 106.388 5 207 

-orts/en 18 13.021 2 1.382 

-mals 14 411.840 0 34 

-teil(s) 14 36.158 2 387 

-willen 10 123 3 81.301 

-zeit(en) 9 285.842 0 31 

-lings 6 907 0 9.923 

-dings 6 360.075 3 17 

-halben 6 1.957 2 3.066 

-halber 5 3.819 0 1.309 

Summe 3.528 38.401.961 1.218 92 
ADV gesamt 3.753 41.223.616 1.228 91 
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- „Präpositionale“ Formen, die auf unabhängig (d.h. in nicht adverbierender 
Funktion) vorkommenden präpositionalen Elementen aufbauen (425 oder 
11% der Typen insgesamt).”* 

- „Suffixale“ Bildungen, die aus der Anfügung meist aus Substantiven abgelei- 
teter Suffixe wie -mal, -(er)weise, -wärts oder -teil(s) hervorgehen. Mit 73% 
machen sie den Großteil (2.752) des Gesamtbestands an Typen aus. 


Es ist ersichtlich, dass die Bildungsweisen von Adverbien - verglichen etwa 
mit den Produkten von Derivation und erst recht Komposition im Bereich 
von Substantiven - nicht sonderlich komplex sind. Mehrfachableitung, d.h. 
die Einbettung bereits komplexer Formen, kommt praktisch nur insoweit vor, 
wie bestimmte Bestandteile von Adverbien innerhalb ihrer (Hauptwortart-) 
Kategorie bereits komplex sind (z.B. aufeinander-zu, braunkohletagebauab- 
bruchkanten-wärts). Adverbien sind in diesem Sinne im Kontrast zu Substan- 
tiven oder Adjektiven nicht-rekursiv, d.h., ein einmal als Adverb kategori- 
siertes Element taugt in aller Regel nicht zu weiteren Ableitungen (vgl. aber 
Abschnitt 5.2). 


3.1 Flexion oder Suffigierung 


Flexion gehört per Definition nicht zur Wortbildung, indem sie - mit Ausnahme 
intuitiv klar bedeutungstragender Plural- oder Komparativmorphologie - erst 
durch die Einsetzung lexikalischer Einheiten in einen bestimmten syntaktischen 
Kontext bestimmt wird. Die Tatsache, dass ein nicht geringer Teil von Adverb- 
typen auf Formen endet, die auch in der Flexion des Deutschen vorkommen, 
deutet darauf hin, dass der Bestand an Adverbien sich in nicht geringem Maße 
aus der Syntax speist. Wir unterscheiden zwischen flexivischen Formen, die bei 
Adverbien häufig sind, aber nicht unbedingt eindeutig Adverbien ableiten und 
Formen, die eindeutig zur Kategorisierung als Adverb führen. 


3.1.1 Bauweisen mit -e, -en und -st 


Von den 80 Typen, die auf -e oder -en enden, enthalten 37 (46%) eine Präposi- 
tion als Erstglied, die in der entsprechenden syntaktischen Konstruktion für das 
Kasusmorphem verantwortlich ist. Das kasusmarkierte Element trägt zur Sätti- 
gung einer der Argumentstellen der Präposition bei. Wir haben im Einzelnen: 


11 Wie im einleitenden Kapitel bemerkt, kommen präpositionale Elemente ansonsten 
praktisch nur im verbalen Bereich als sog. Verbpartikeln vor. 
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(6) a. insbesondere, beinahe, zustande, zugute, zuhause, zugrunde, zunichte, 
beiseite, beileibe, imstande, zumute, zunutze, außerstande, zuwege, 
zuleide, zuhilfe 

b. zusammen, ansonsten, bisweilen, zuweilen, abhanden, mitnichten, von- 
statten, vonnöten, beisammen, zuhanden, zuschanden, außen, mitsam- 
men, vondannen, ohnesorgen, insgleichen, vonnutzen 


Die Häufigkeit der Endung -st unter den als Adverbien getaggten Typen ist auf- 
fällig. Von 49 einschlägigen Typen sind 33 eindeutig Adverbien, d.h., sie kom- 
men im Korpus nicht weitergehend flektiert vor (z.B. vorerst, demnächst, dereinst 
oder tunlichst). Von diesen 33 Typen beginnen 20 mit der präpositionalen Form 
zu (z.B. zuletzt, zunächst, zuoberst). Wenn zu Erstglied ist, liegt eindeutig ein 
Adverb vor, vgl. (7) und Abschnitt 5.2. 


(7) a. Das (*zu)oberste Brett 
b. *(Zu)oberst liegt ein Brett 


3.1.2 Bauweisen mit -s 


Besonders frequent unter den flexivischen Elementen im Bereich der Adverbien 
ist suffigiertes -s, dem traditionell zumeist genitivischer Ursprung zugeschrieben 
wird (vgl. z.B. Paul 1920: 129 und Beispiele für den sogenannten adverbiellen 
Genitiv wie eines Tages, des Wegs, meines Erachtens). Daneben speist sich das für 
Adverbierung typische -s aus verschiedenen Quellen. Erstens endet ein guter 
Teil der adverbableitenden Suffixe auf -s: 


(8) himmelwärts, mancherorts, keinesfalls, seinerseits 


Zweitens tritt -s zu Formen, die schon Adverbien waren oder ganz überwiegend 
adverbial gebraucht wurden: 


(9) bereits, öfters, insbesonders, jeweils 


12 Potentiell einschlägig sind auch die sich aus verschiedenen Quellen speisenden For- 
men mitschiffs, vollends, nirgends, zusehends sowie eilends. Nach dem DWB (1854- 
1961) ist bei den letzten drei Typen -d- sekundär eingefügt; Paul (1897) ordnet eilends 
als Partizip I mit Genitiv-s ein. Die Nähe von Partizipien I zu Adverbien ist Gegen- 
stand von Abschnitt 3.3. 
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Drittens kann -s gegen Präpositionen in adverbial gebrauchten Präpositional- 
phrasen getauscht werden: 


(10) -s ADV PP ADV 
anfangs, flugs am Anfang, im Fluge 
übrigens, rechtens im Übrigen, im/zu Recht 
mindestens, schärfstens im Mindesten, am schärfsten 
erstens ... siebzigstens zum Ersten ... Siebzigsten 


Namentlich die synchron produktiven Bildungen aus Superlativformen (schärfs- 
tens, mindestens) haben Entsprechungen mit den präpositionalen Elementen im, 
am oder zum. Unter Abzug der nicht-flexivischen Suffixbildungen auf -s (-wärts, 
-seits, -orts etc., s. 9) ist die Verteilung der flexivisch endenden Formen wie folgt 
(wiederholt aus Tab. ı, s. dort für Erläuterungen). 


Tabelle 2: Flexivische Typen, Tokens, Hapaxlegomena und TTRs. 


Typen Tokens Hapaxlegomena | TTRx10° 


-stens 60 287.606 6 209 

+ 66 + 13.787 +6 418 
-S 74 | 1.670.678 10 44 
-en 49 396.643 2 124 
-st 33 | 1.086.391 4 30 
-ens 5 58.883 0 85 
-e 31 486.786 2 64 


-stens liefert also von allen flexivisch endenden Formen die meisten Typen und 
hat auch die höchste Type-Token-Ratio, die als ein erster Anhaltspunkt für 
höhere Produktivität gesehen werden kann. Wilmanns (1896: 610) hat zu Recht 
die Besonderheit des Superlativs, in prädikativer Position nicht „nackt“, sondern 
in Begleitung einer mit dem definiten Artikel verschmolzenen präpositionalen 
Form zu erscheinen (am schnellsten), für den Sonderweg verantwortlich gemacht, 
den der Superlativ im Bereich der Morphosyntax und Wortbildung verglichen 
mit dem Positiv und Komparativ genommen hat.'* Das Vorhandensein des 


13 In ähnlicher Weise sind adverbiale Nominalphrasen im Genitiv (= adverbiale Geni- 
tive) oft gegen Präpositionalphrasen austauschbar, vgl. z.B. eines Abends - an einem 
Abend; meines Wissens - nach meinem Wissen. 

14 In Richtung der Vermutung, dass der Wortartenwechsel zwischen Adjektiven und 
Adverbien durch einen Ableitungsprozess (Suffigierung bzw. Konversion) geregelt ist 
bemerkt Wilmanns (1896: 610): 
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präpositionalen Elements eröffnet für den Superlativ die Möglichkeit der Teil- 
habe an breit applizierenden Bildungsmustern, die Konstruktionen mit bestimm- 
ten Präpositionen mit flexivischen Wortbildungsprodukten verbinden; in diesem 
Zusammenhang einschlägige Prozesse reichen zum Teil weit zurück (im Fall des 
Umbaus von Fügungen wie im günstigen/besten Fall zu günstigen-/ bestenfalls), 
zum Teil sind sie rezent (wie im Fall von anbetrachts aus in Anbetracht, analog zu 
angesichts aus im Angesicht oder das angesichts der Herkunft der Belege offen- 
bar in der Schweiz geläufige auftrags, aus im Auftrag). (11) veranschaulicht den 
Umbau von adverbialen Präpositionalphrasen zu auf -s endenden Adverbien. 


(11) PP ~~ ADV 
| 
p N anfangs 
| | ubrigens 
zu(m) Anfang schnellstens 
im übrigen 


am schnellsten 


Die Superlativformen exemplifizieren ein typisches Grammatikalisierungs- 
muster, indem Abbau der Markierung (Präposition gegen -s) mit semantischer 
Schwächung einhergeht: Die Bedeutung wird von der Quantifikation über Indi- 
viduen in Vergleichen zu einer nurmehr elativischen Modifikation von Gesche- 
hen verschoben. Die s-Suffigierung liefert ein eindeutiges Adverb, das im Stan- 
darddeutschen nicht prädikativ erscheinen kann: 


(12) Ben war am schnellsten/*schnellstens. SCHNELLER.ALS(Ben,jeder) 


In Richtung der Davidson’schen Intuition (vgl. Abschnitt 1.3) denotieren Sub- 
jekte von marginal prädikativ erscheinenden stens-Adverbien Geschehen, vgl. 
den folgenden grammatisch fragwürdigen Beleg aus einem Internetforum: 


(13) Die Lieferung war schnellstens [...]. SEHR.SCHNELL(die Lieferung) 
(https://www.ebay.de/usr/ctec48flo, abgerufen am 4.12.2019) 


Im Positiv und Comparativ führte bei den meisten Adjectiven die Lautentwicklung 
zum Zusammenfall des Adverbiums und des prädicativen Adjectivs, im Positiv durch 
die Apokope der Adverbial-Endung, im Comparativ durch Apokope der Adjectiv- 
Endung; im Superlativ dagegen, wo sich das Adjectivum gern mit dem Artikel ver- 
bindet, blieben eben dadurch die beiden Formen unterschieden und das Adverbium 
ging seine eigene Bahn. Schliesslich freilich wirkte der Mangel an Unterscheidung im 
Positiv und Comparativ auch auf den Superlativ, und zwar in der Weise, dass das mit 
am gebildete Adverbium das Adjectivum zurückdrängte. 
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3.2 Präpositionen als Bausteine 


Wenn man bedenkt, dass Präpositionen in der Syntax die prototypischen adver- 
bialen Relatoren sind und die Syntax eine wichtige Quelle für sekundäre Wör- 
ter darstellt, überrascht es nicht, dass mittels Präpositionen gebildete Adver- 
bien eine Gruppe von beträchtlicher Größe ausmachen." Tatsächlich werden 
vornehmlich als Präpositionen kategorisierte Einheiten mitunter als Adverbien 
analysiert, da sie insbesondere in Bildungen mit dem Pro-Adverb da (sog. Prä- 
positional- oder Pronominaladverbien) mit eindeutig als Adverb zu kategori- 
sierenden Einheiten konkurrieren und hier auch „abgespalten“ für sich stehen 
können (Krause 2007: 476):"° 


(14) a. d(a)r-in - dr-innen, d(a)r-aus — dr-außen 
b. Davon hält sie nichts - da hält sie nichts von. 


Darüber hinaus können einzelne Präpositionen, ihre Nähe zu Adverbien 
unterstreichend, auch ohne Ergänzung wie Adverbien gebraucht werden (vgl. 
Abschnitt 4.1). Präpositionen erscheinen in Adverbbildungen als Erst- oder 
Letztglieder; ihrer Nähe zu Adverbien und allgemeinen Prinzipien der Wort- 
bildung gemäß - kategorien- und bedeutungsbestimmende Elemente stehen 
rechts - überwiegen jedoch Bildungen mit nachgestellten Präpositionen wie 
darum, weitaus oder zweifelsohne. Die ganz überwiegende Zahl der Bildungen 
basiert auf den 20 sogenannten primären Präpositionen: 


(15) ab, an, auf, aus, bei, durch, für, gegen, hinter, in/ein, mit, nach, neben, über, 
um, unter, von, vor, zu, zwischen 


15 Die 37 Typen, die Präpositionen sowohl als Erst- wie als Letztglieder enthalten (z.B. 
durchaus, mitunter, voran), wurden zu den Bildungen mit Letztgliedern geschlagen. 
Bildungen mit Präpositionen bzw. mit ihnen gleichlautenden Einheiten in Mittelstel- 
lung wie allzuviel, sozusagen wurden nicht gezählt. Die Form zu fungiert in allzuviel 
als Gradpartikel, in sozusagen als Infinitivpartikel. Diachron hängen diese Formen mit 
der Präposition zu zusammen, die funktionale Abspaltung liegt allerdings weit vor der 
Bildung von allzuviel und sozusagen. Vgl. zu möglichen semantischen Gemeinsam- 
keiten der verschiedenen zu-Formen Brandt (2019). 

16 Geuder (2019:222) beschreibt Präpositionaladverbien als durch Sättigung der Argu- 
mentstelle der Präposition abgeleitete Adverbien, sieht sie jedoch als isolierte Fälle. 
Die Betrachtung von Adverbien als intransitive Präpositionen ist in der generativen 
Grammatik nicht unüblich, vgl. Lee (1999). 

17 Parallel dazu können semantisch transparente Verbzusätze in sog. Partikelverben 
auch prädikativ gebraucht werden: die Tür zumachen > die Tür ist zu, vgl. dagegen mit 
etwas aufhören > *es ist auf. 
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Einzig die primären Präpositionen sind an der Bildung von Präpositionaladver- 
bien beteiligt (daran, darauf, ... dazu). Präpositionaladverbien machen den für 
Adverbierung wesentlichen Umbau von Relationen zu Eigenschaften anschau- 
lich (vgl. 4.1): Eine der Proformen da, hier oder wo realisiert das interne Argu- 
ment der Präposition formal, stellt aber anaphorisch oder deiktisch Bezug zu 
etwas anderem her; textfunktional sind also nach wie vor Relationen gegeben."® 
Das Verbauen von Proformen ist in der Wortbildung ansonsten unüblich, eröff- 
net allerdings attraktive Möglichkeiten: So können Präpositionaladverbien ins- 
besondere Bezüge zwischen propositionalen Gehalten herstellen, deren Träger- 
ausdrücke als direkte Ergänzungen von Präpositionen nicht in Frage kommen 
(vgl. *Daher rechne er mit, dass ...). Unter Austausch von da (bzw. dem selteneren 
hier) durch wo kehren sich dabei die Einbettungsverhältnisse zwischen einbet- 
tender und eingebetteter Proposition um:” 


(16) a. Daher rechne er damit, dass Ende Oktober tatsachlich produziert wer- 
den kann. (die tageszeitung, 1.10.2007, 0. S.) 
b. Das Bruttoinlandsprodukt hat sich zum Vorquartal um 0,7 Prozent 
erhöht, womit Experten gerechnet hatten. (dpa, 20.10.2006, o. S.) 


Die Bildungen mit den Proformen da, hier und wo stellen den regelmäßigsten 
Typ der Bildungen mit Präpositionen überhaupt dar, indem 19 der 20 primä- 
ren Präpositionen (Ausnahme: ab) daran in gleicher Weise, wenn auch unter- 
schiedlich frequent beteiligt sind. Die niedrigen Type-Token-Ratios in Tab. ı 
deuten schon darauf hin, dass der Hauptanteil der Bildungen mit Präpositionen 
auf vergangener Produktivität beruht. Dabei bilden Formen mit präpositiona- 
len Letztgliedern eine gegenüber Bildungen mit präpositionalen Erstgliedern 
insgesamt homogenere Gruppe (vgl. Abschnitt 4.2). Abschnitt 4 bietet eine 
eingehendere, binnendifferenzierte Darstellung der Bildungen mit primären 
Präpositionen.”° 


18 Die Formen da, hier und wo sind jeweils semantisch bzw. pragmatisch unmarkiert in 
dem Sinne, dass ihr außersprachlicher Bezug mehr oder weniger garantiert ist: da ist 
die in der Dimension der Nähe bzw. Ferne zur sprechenden Person gegenüber dort 
bzw. hier neutrale Form, hier kann immer mit dem Äußerungsort identifiziert wer- 
den. Wo fungiert als W-Form mit lokaler Grundbedeutung auch als „universelles Rela- 
tivadverb“ (Eisenberg 2013: 277), was plausiblerweise mit der Allgemeinheit seiner 
Bedeutung und dem Metaphorisierungspotential lokaler Ausdrücke zusammenhängt. 

19 Dieselben 20 primären Präpositionen kombinieren als Erstglieder mit einander, einge- 
schränkt ist daran auch die Präposition ohne beteiligt. 

20 Neben den primären Präpositionen finden vor allem ohne und seit Eingang in kom- 
plexe Wortbildungstypen, außerdem selbst schon komplexe präpositionale Formen 
wie zufolge. 
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3.3 Externe und interne Rollen: Suffixbildungen mit -erweise 
und -ermaßen 


Der Bau von Adverbien mittels Suffixen wird an anderer Stelle behandelt und 
steht hier nicht im Mittelpunkt (s. auch Fleischer & Barz 2012: 366-370, Heinle 
2004, Ronca 1975). Die korpuslinguistische Betrachtung bestimmter Ausschnitte 
erhellt jedoch hier zentral stehende Zusammenhänge und liefert Hinweise zur 
Produktivität einzelner Bausteine; dazu werden im Folgenden die Suffixe -erweise 
und -ermafen genauer miteinander verglichen. Grundlage dieses Teils stellt der 
Datensatz ADVERBIEN_2 dar (s. Abschnitt 2). 

Im Hinblick auf einen für die Adverbierung erforderlichen relationalen Input ist 
bemerkenswert, dass ein großer Teil der nominalen Basen der adverbableitenden 
Suffixe relational ist: x-wärts bedeutet, dass die Richtung von etwas x ist; x- weise, 
dass die Weise von etwas x ist, x-orten, dass der Ort von etwas x ist. Die Basis x 
sättigt in diesen Bildungen die interne Argumentstelle der Beziehung und stellt 
damit eine Eigenschaft her, die als Prädikat eines Geschehens fungieren kann. 

Weiteres Licht auf die relevanten Strukturen wirft nun der Vergleich von 
Suffixbildungen mit -erweise und -ermaßen. Wie oben in Abschnitt 1.3 diskutiert, 
sind Partizipien I durch ihren AGEns-Bezug für adverbialen Gebrauch prädesti- 
niert. Bildungen aus Partizipien I und -erweise haben oft pleonastischen Charak- 
ter (vgl. Elsner 2016: 215, Ronca 1975), d.h., die Bildung eines Partizips I macht 
die erweise-Suffigierung für den adverbialen Gebrauch eigentlich überflüssig. 
Der Abzug des erweise-Letztglieds im repräsentativen Beispiel (18) etwa würde 
kaum ins Gewicht fallen. 


(17) So wurde man sitzenderweise Zeuge einer Materialschlacht, aus O-Tönen 
und Kamerafahrten, die um sich selber kreiste. (die tageszeitung, 23.9.1991, 
S. 18) 


Partizipien II müssen dagegen für den adverbialen Gebrauch markiert werden.”* 
In aller Regel geschieht dies durch -erweise (43 Typen) oder insbesondere durch 
das auf Partizipien II spezialisierte Suffix -ermaßen: 60 von insgesamt 77 Typen 
oder 78% der Bildungen mit -ermafen haben Partizipien II als Basen, wobei sich 
die Ausnahmen einerseits bei „originellen“ Typen mit wenigen Tokens finden 


21 Die im Korpus vorkommenden adverbial nutzbaren „nackten“ Partizipien II bestimmt, 
ungelogen sowie das komplexere saisonbedingt beziehen sich als Adverbien auf Pro- 
positionen und nicht auf Geschehen, d.h., sie modifizieren die Art des Gegebenseins 
propositionaler Gehalte und nicht die Art (und Weise) von Geschehen. Wie die meis- 
ten Partizip-II-ermafen-Wortbildungen und im Kontrast zu Partizip-II-erweise-Wort- 
bildungen können sie z.B. als Antworten auf Satzfragen fungieren. 
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(z.B. pikantermaßen, stolzermafsen mit je einem Token) und andererseits bei 
offenbar alten, hochfrequenten Typen mit sehr allgemeinbedeutenden, funkti- 
onswortartigen Basen (z.B. gleichermaßen: 11.220 Tokens; einigermaßen: 8.935 
Tokens; dermaßen: 2.663 Tokens). Bekanntlich beziehen sich Partizipien II auf 
interne (PATIENS-)Argumente; dass dies ebenso bei Bildungen mit -ermaßen der 
Fall ist zeigt sich auch daran, dass es hier keine inkorporierten Objekte gibt, wie 
sie bei Bildungen aus Partizipien I und -erweise durchaus vorkommen (z.B. ehren- 
rettenderweise, erbsenzählenderweise). Außer in folgendermaßen (1.622 Tokens) 
und zwingendermaßen (5 Tokens) kombiniert -ermaßen nicht mit Partizipien I; 
pleonasmusverdächtige Bildungen aus Partizipien I und -erweise sind mit 142 
Typen dagegen recht häufig. Abb. 2 vergleicht die Produktivität der beiden Suf- 
fixe anhand von Wortschatzwachstumskurven, die den Suffixbildungen mithilfe 
des Softwarepakets zipfR unter Anwendung des finiten Zipf-Mandelbrot-LNRE- 
Modells (vgl. Evert & Baroni 2007) zugeordnet werden können. 


Wortschatzwachstum: -erweise vs. -ermaßen 


Lemmata/Hapaxlegomena 


-erweise 


-ermaßen 


T 
0e+00 2e+04 4e+04 6e+04 8e+04 1e+05 


Tokens 


Abbildung 2: Anzahl der Lemmata (dickere Kurvenlinien) und der Hapaxlegomena 
(dünnere Kurvenlinien) bei steigenden Tokenzahlen von Bildungen auf -erweise 

bzw. -ermaßen (gemäß dem finiten Zipf-Mandelbrot-Modell in zipfR). Bei Bildungen 
auf -ermaßen werden die Wachstumskurven über die beobachtete Anzahl der Tokens 
(36.538, gestrichelte Linie) hinaus so weit extrapoliert, bis die beobachtete Anzahl der 
Tokens von Bildungen auf -erweise (111.937, Ende der Skala) erreicht wird. 


Während die Wachstumskurve für die Lemmata auf -erweise am rechten Rand 
der Abb. 2 immer noch steil ansteigt, flacht sie für die Lemmata auf -ermaßen 
deutlich schneller ab. Ähnliches zeigt sich beim Vergleich der Kurven für die 
Hapaxlegomena: Die Kurve für -erweise steigt am rechten Rand der Abbildung 
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immer noch deutlich an, während die Kurve für -ermaßen dort kaum mehr Stei- 
gung zeigt. Das offenbar kaum beschränkte Suffix -erweise ist also entschieden 
produktiver als -ermaßen. Dabei ist bemerkenswert, dass die spezifische Produk- 
tivität „redundanter“ erweise-Ableitungen aus Partizipien I noch größer zu sein 
scheint: Fast zwei Drittel der entsprechenden Typen (90 von 142) sind Hapaxle- 
gomena gegenüber weniger als der Hälfte der Typen (408 von 873) insgesamt (die 
p-Werte am Ende der Skala sind 3,55e-3 für -erweise und 3,27e-4 für -ermaßen). 


4 Bildungen mit primären Präpositionen 


Als prototypische adverbiale Relatoren in der Syntax vermitteln Präpositio- 
nen zwischen vor allem durch Verben kodierten Geschehen und Denotata von 
Nomen, die als Komplemente von Präpositionen fungieren und deren interne 
Rolle sättigen. Die externe Rolle entspricht dem Geschehen, das der Satzaus- 
druck insgesamt beschreibt, der die adverbiale Präpositionalphrase enthalt.”” 


4.1 Relation und Eigenschaft 


Mit Lehmann (2002: 78) besteht die Beziehung zwischen z.B. der Präposition 
über und dem Adverb oben darin, dass Quantifikation der internen Argument- 
stelle an deren explizite Sättigung durch eine Nominalphrase tritt: 


(18) a. Er ist über dem Dach. UBER(er,das.dach) 
b. Er ist oben. 3 x UBER(er,x) 


Die interne Bindung von Argumentstellen im Zuge der Adverbierung lässt sich 
auch beobachten, wenn z.B. in syntaktischen Phrasen präsente pronominale Ele- 
mente zugunsten einer generischen Interpretation gelöscht werden: 


(19) zeit meines/deines/seines Lebens — zeitlebens 


Der Schritt von vollen Nominalphrasen zu Pronomen bildet womöglich eine Vor- 
stufe zur internen Bindung von Argumentstellen, vgl. insbesondere die nicht 
standardgemäßen, aber im Korpus recht häufigen Formen aus (20c) und (20d): 


22 Man vergleiche attributiv verwendete Präpositionalphrasen wie der Mann auf der 
Brücke, die plausiblerweise auf relativ angeschlossene Konstruktionen zurückgehen: 
der Mann, (der) auf der Brücke (ist). 
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(20) a. wegen der Tochter — ihretwegen 
b. wegen des Wetters — deswegen 
c. dem Papst zufolge — ihmzufolge 
d. dem Papst nach — ihmnach 


Präpositionen sind praktisch die einzigen Elemente, die innerhalb der Wortbil- 
dung mit Proformen verknüpft werden.” Proformen sind formal referentielle 
und also argumentstellensättigende Ausdrücke, die aber kaum zur Bedeutung 
beitragen, vgl. die Diskussion in Abschnitt 3.2. 

Zwischen den 20 primären Präpositionen bestehen wesentliche Unterschiede 
bezüglich der Sättigung der internen Argumentstelle: Manche Präpositionen 
können auch ohne overte Sättigung adverbial fungieren, andere nicht. Der exem- 
plarische Vergleich von Typen, in denen die Präpositionen durch bzw. um als 
Letztglieder fungieren, liefert Hinweise auf zugrundeliegende Mechanismen. Es 
fällt zunächst auf, dass um weit mehr Typen liefert als durch (47 vs. 21). Die 
nähere Betrachtung zeigt, dass der Vorsprung an Typen mit um v.a. der Existenz 
von Varianten mit bzw. ohne overt realisiertes Richtungsadverb (oder dessen 
Kurzform) geschuldet ist;?* bei durch fehlen solche Varianten weitgehend (vari- 
ierende Formen sind durch Verknüpfung mit „-“ markiert): 


(21) a. rundum - rundherum; ringsum — ringsherum; andersum - andersrum - 
andersherum; rum — herum; weitum — weitherum; hintenrum — 
hintenherum; linksum - linksrum - linksherum; rechtsum - rechtsrum — 
rechtsherum; untenrum — untenherum; außenrum - außenherum, 
vornerum — vorneherum; hierum — hierherum; wiederum — 
wiederherum; darum — daherum, rumherum — darumherum 

b. kurzum, reihum, hinwiederum, ebendarum, verkehrtherum, obenherum, 
falschherum, richtigherum, vornerum, irgendwarum, weiterherum, 
umeinanderherum, worum 


(22) a. zwischendurch - zwischenhindurch; mittendurch - mittenhindurch; 
dadurch - dahindurch; wodurch — wohindurch 
b. hindurch, untendurch, querdurch, ebendadurch, hintendurch, unterdurch, 
obendurch, vornedurch, drunterdurch, halbdurch, zickzackkursdurch, 
weiterdurch, hierdurch 


23 Mögliche Ausnahmen bilden vereinzelte Rektionskomposita wie Allesfresser/-könner, 
sofern das Element alles hier als Pronomen analysiert wird. 

24 Als Quelle für die Kurzform kommen auch Bildungen mit da in Frage; s. u. zur prono- 
minalen Qualität der Richtungsadverbien hin und her. 
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Die Varianten in (21) sind großteils synonym verwendbar, bezüglich der Vari- 

anten in (22) besteht völlige Synonymie in der lokalen Lesart. Im Fall von durch 

besteht offenbar die Möglichkeit der nur oberflächlichen Löschung einer formal 

leerstellensättigenden Proform. Das auch pronominal fungierende Richtungs- 

adverb hin scheint in Vorkommen von durch funktional oder bedeutungsseitig 

schon enthalten zu sein: 

1. durch und hindurch sind bei trennbaren Partikelverben in lokaler Lesart salva 
veritate austauschbar (Simeékova 2002: 102). 

2. durch ist nur mit vorangestelltem hin kompatibel (weshalb z.B. für um vor- 
handene Varianten mit her fehlen, s. o.). 

3. In den Adverbtypen finden wir viel durch ohne Richtungsadverb, aber nicht 
um ohne Richtungsadverb.”° 


Die interne Stelle von um muss, bevor es als Adverb fungieren oder weiter kom- 
poniert werden kann, transparent gesättigt werden. Dies geschieht zumeist durch 
das Richtungsadverb her, aber auch substantivische oder adjektivische Stämme, 
die mit Richtung bzw. Lokalisation zu tun haben, können diese Funktion aus- 
üben (reihum, ringsum, rechtsum). Die tendenzielle Funktionsfähigkeit von durch 
gegenüber um zeigt sich dabei auch syntaktisch in der Vorfeldfähigkeit - alleini- 
ges Auftreten im Vorfeld ist für um im Teilkorpus nie, für durch dagegen 53 mal 
der Fall, vgl. z.B. (23). 


(23) Durch kam er nie. (dpa, 10.07.2009, 0.S.) 


Dafür, dass herin Kombination mit um argumentstrukturell wirksam ist, spricht 
im Übrigen, dass um kombiniert mit dem origo-orientierten her als Verbpartikel 
zu einer Verallgemeinerung der Bedeutung führt. Das geht systematisch mit der 
internen Bindung der Stelle des direkten Objekts einher, vgl. z.B. (24), wo die 


25 Ähnlich argumentiert auch die GDS (1997: 2087) für bestimmte Verwendungen von 

durch; vgl. ebenfalls Behaghel (1924: 23): 
Die Präposition ist in der Regel ein Adverb von relativer Bedeutung, das seine 
Bestimmung durch eine unmittelbar davon abhängige Größe erfährt, und zwar 
durch eine solche, die für sich allein in dem gegebenen Satzzusammenhang nicht 
erscheinen könnte: mit Recht, der Eier wegen, bis jetzt. In einer Wendung wie er 
schläft die Nacht durch ist durch noch nicht Präposition, da es auch heißen könnte: 
er schläft die Nacht; [...]. Doch ist eine völlig strenge Scheidung zwischen Präpo- 
sition und Adverb nicht durchführbar. 

Die pronominale Funktion von Richtungsadverbien scheint in Substitutionen wie den 

folgenden durch: es kommt dazu - es kommt hinzu; er kommt heran - er kommt zu mir, 

x ist drüber - x ist hinüber. 
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Unmöglichkeit, die Präposition an wegzulassen, aufzeigt, dass Schokolade nicht 
als direktes Objekt von herumbasteln lizenziert ist. 


(24) Und es gibt viele hier, die mehr oder weniger erfolgreich *(an) Schokolade 
herumbasteln. (Süddeutsche Zeitung, 28.9.2012, S. 11) 


Die äußerst produktive Kombination von herum mit nahezu beliebigen Verben 
verweist wiederum auf einen Zusammenhang zwischen semantischer Harmlo- 
sigkeit (Redundanz bzw. Schwächung) und Produktivität (vgl. Abschnitt 3.3). 


4.2 Erst- und Letztglieder 


Sofern präpositionale Elemente maßgeblich für Adverbierung sind, erwarten wir 
dem Prinzip der Rechtsköpfigkeit gemäß, dass sie als Letztglieder erscheinen 
(vgl. oben Abschnitt 3.2). Das Gros der Typen in ADVERBIEN_1, die präpositionale 
Elemente enthalten, bestätigt diese Erwartung; zu und vor sind jedoch als Erst- 
glieder signifikant überrepräsentiert, vgl. Abb. 3.?° 

zu und vor sind in je verschiedenen Dimensionen diversifiziert: zu ist bezüg- 
lich seiner Form stabil, variiert aber funktional, indem es in seinen Hauptver- 
wendungen als Präposition, als Gradpartikel und als Infinitivmarker fungiert. In 
ähnlicher Weise, wenn auch weniger augenfällig, haben die Präpositionen in und 
an Funktionen im Bereich der Graduierung bzw. im Bereich Tempus und Aspekt: 
Sie begleiten insbesondere Superlative (am besten, im mindesten) und haben in 
Kombination mit Infinitiven aspektuelle Funktion, vgl. die Beispiele für die soge- 
nannte rheinische Verlaufsform: 


(25) Es muss ein bisschen was passieren, wir sind am verhandeln. (Braun- 
schweiger Zeitung, 3.3.2011, 0. S.) 


(26) Der Linksextremismus ist im abklingen, das kann man sagen. (Zeit Online, 
28.2. 2001, 0. S.) 


Auf eine rekonstruierte Wurzel “per zurück gehen vor und die nicht-lokative 
Form für sowie das verbale Präfix ver-,?’ das systematisch aspektuell wirksam ist. 


26 Vgl. zu zu als Erstglied auch Abschnitt 3.1.1. Beispiele für vor als Erstglied sind vorab, 
voran, voraus, vorbei, vorerst, vor(vor)gestern, vorher, vorhin, vormals, vorüber. 

27 Vgl. Seebold (2002). Als verbale Präfixe sind zu- und ver- sehr produktiv und in der 
aspektuellen Dimension auf die Kodierung von Zustandswechseln spezialisiert. zu 
und vor lizenzieren als einzige verbale Präfixe bzw. Partikeln systematisch Dativar- 
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Abbildung 3: Assoziationsplot für primäre Präpositionen als Erst- und Letztglieder in 
ADVERBIEN_1 (X? = 147, df = 19, p < 2,2e-16, Cramérs V = 0,52). Die Höhe der Balken visuali- 
siert den Grad der standardisierten Abweichungen (Residuen) von den erwarteten Wer- 
ten, wobei Balken oberhalb der gepunkteten Linie höhere, Balken unterhalb niedrigere 
Werte als erwartet bedeuten. Die Breite der Balken ist proportional zu den erwarteten 
Häufigkeiten. Blaue Einfärbung steht für signifikante Abweichung (+/- 1,97) nach oben, 
rote Einfärbung für signifikante Abweichung nach unten. 


Die Vielfalt der Typen mit zu als Präfix ist vor allem zwei Bauweisen zu verdan- 
ken, von denen die erste direkt als Umbau aus der Syntax erkennbar ist, indem 
das nominale oder adjektivische Letztglied in der Regel eine von zu verantwor- 
tete Dativendung trägt (sortiert nach absteigender Häufigkeit): 


(27) zurück, zudem, zurzeit, zugute, zustande, zurecht, zugrunde, zuweilen, 
zuhause, zuteil, zueinander, zunichte, zuliebe, zuhauf, zunutze, zumute, 
zutage, zuhanden, zuwege, zuleide, zuschanden, zugut, zuhilfe, zupasse, 
zuweil, zualledem 


Die zweite Bauform basiert auf zu und Superlativen (sortiert nach absteigender 
Haufigkeit):”* 


gumente (jemandem zuarbeiten ggüb. *jemandem arbeiten, jemandem vorlesen vs. 
*jemandem lesen), was dafür spricht, dass die Elemente eine Variable ins Spiel bringen, 
die durch das Dativargument gebunden werden kann (vgl. Brandt 2003, Hole 2014). 
28 Die übrigen Typen mit vorangestelltem zu sind: zunächsteinmal, zuvor, zugleich, 
zumal, zuviel, zuwenig, zusehends, zuwider. Als einzige präpositionale Form kann 
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(28) zunächst, zuletzt, zumindest, zuerst, zumeist, zutiefst, zuallererst, zuoberst, 
zuvorderst, zumindestens, zuvörderst, zuhinterst, zuallerletzt, zuunterst, 
zuinnerst, zuallermeist, zuhöchst, zualleroberst, zuäußerst, zuallernächst, 
zuallermindest, zuallervorderst, zuallervörderst 


Die Möglichkeit der rekursiven - und semantisch redundanten - Einbettung des 
quantifizierenden Elements aller macht die in (29) exemplifizierte Bauweise zur 
Basis prinzipiell unendlich vieler neuer Typen (vgl. unten Abschnitt 5.2). 

Wenn wir die Typen mit präpositionalen Letzt- und Erstgliedern vergleichen, 
wird klar, dass erstere entlang typischer Wortbildungsregeln erzeugt werden: Die 
vorgefundenen Typen sind relativ gleichmäßig über die verschiedenen Präposi- 
tionen — mit Ausnahme von zu und vor - verteilt, sie enthalten kaum flexions- 
verdächtige Elemente,” und der präpositionale Kopf steht rechts. Insbesondere 
die Typen mit Proformen als Erstglied - da, hier, wo, dem, her, hin, so - appli- 
zieren breit über alle Präpositionen. Die Typen mit Substantiven, Adjektiven 
oder Adverbien als Erstglied enthalten regelmäßig ein optionales Bindeelement 
in Mittelstellung, das offenbar den Vollformen der Richtungsadverbien hin 
bzw. her bzw. auch der Proform da(r) zu verdanken ist, vgl. z.B. berg(he)runter, 
oben(dr)auf. Wieder muss die interne Stelle der Präposition gesättigt werden, 
bevor das Produkt ein Kompositum mit einem anderen freien Morphem bil- 
den kann. Bei den Typen mit Präpositionen als Erstglied dagegen fehlen sol- 
che Bindeglieder. Stattdessen weisen insbesondere die Typen mit Substantiven, 
Adjektiven oder Adverbien die Endungen -e oder -en auf, die offenbar Reflexe 
eines durch die Präposition in der Syntax zugewiesenen Dativkasus sind (s. auch 
oben 6 und Abschnitt 3.1.1). Es handelt sich also nicht um eigentliche Wortbil- 
dungen bzw. nach Wortbildungsregeln erzeugte Typen, sondern um mehr oder 
weniger transparente Umbauten aus der Syntax. 


5 Vergleiche und Adverbierung 


Die Werte in Tab. ı geben einen Hinweis darauf, dass superlativische Bildun- 
gen im Bereich des Adverbs besonders stark vertreten und produktiv sind; dies 
gilt insbesondere für eindeutig adverbmarkierende, auf -stens endende Formen, 


zu mit gradierender Bedeutung in Mittelstellung vorkommen, nämlich in allzugern, 
allzuoft, allzuviel oder vielzusehr, vielzuoft. Die quantifizierenden Elemente all bzw. 
vielscheinen hier die Zusammenschreibung zu ermöglichen, vgl. unten Abschnitt 5.2. 
Weitere Formen sind dazumal, dannzumal, annodazumal, sozusagen. 

29 In Fällen wie hint-en-an oder tag-s-über sind -en- bzw. -s- als Teil des als Erstglied 
fungierenden Adverbs bzw. als Fugenelement anzusehen. 


88 — Bau von und Umbau zu Adverbien 


die als semantisch schwächere (nämlich elativische) Formen auf Superlative 
bezogen sind, die durch Präpositionalphrasen ausgedrückt werden (vgl. oben 
Abschnitt 3.1.2). Wie fügt sich die Popularität superlativischer Formen in das 
hier entstehende Bild der Adverbierung? 


5.1 Schwache Komparative 


Der Bereich der Komparation ist variationsträchtig, da eine Vielzahl an Aus- 
drucksmöglichkeiten einer offenbar stark beschränkten Auswahl an Bedeutun- 
gen gegenübersteht. Die Sätze in (29) etwa bedeuten je dasselbe, und die Bedeu- 
tungsunterschiede der Sätze in (30) können je nach Kontext minimal ausfallen.” 


(29) a. Ben ist schwerer als / nicht so leicht wie Bo. 
b. Bo ist leichter als / nicht so schwer wie Ben. 


(30) Ben ist zu/etwas/aber schwer / nicht leicht genug / schwerer als zulässig. 


Im Bereich des adverbialen Gebrauchs bewirken superlativische Formen von 
Adjektiven gegenüber flexionslosen vor allem Emphase oder Intensivierung 
(z.B. 31a), während wahrheitsfunktionale Unterschiede eine eher untergeord- 
nete Rolle spielen (z.B. 31b). 


(31) a. Er grüßte herzlich. ~ Er grüßte herzlichst. 
b. Er kam schnell. = Er kam schnellstens. 


Auch für den adverbialen Gebrauch von Adjektiven gilt, dass absolut vorkom- 
mende komparierte Formen ohne kontextuelle Verankerung zu schwächeren 
Bedeutungen führen als nicht komparierte Formen:** 


(32) a. Das habe ich aber schon länger gewusst. (Saale-Zeitung, 11.7.2012, 
S. 11) 
b. Bert Schreiber hat’s schon lange gewusst. (Mannheimer Morgen, 
5.5.2006, 0. S.) 


Der Umstand, dass komparierte Formen bei einem Mehr an Ausdruck tatsächlich 
ein Weniger an Bedeutung liefern, mag zu ihrer Beliebtheit für den adverbialen 


30 Bedeutung verstehen wir wahrheitsfunktional, d.h., wir abstrahieren von eventuellen 
Unterschieden bezüglich des Gebrauchs (Pragmatik) und eventueller Kollokationen etc. 
31 Siehe dazu auch Becker (2005). 
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Gebrauch beigetragen haben, indem er die verwendete Morphologie dafür frei 
macht, eben anderes als stärkere Bedeutungen zu markieren.” Bemerkenswert 
ist, dass die im Falle des Superlativs in adverbialer Funktion notwendig erschei- 
nende präpositionale Form am ... -sten und die mit ihr verbundene, eindeutig 
Adverbien markierende -stens-Form (vgl. Abschnitt 3.1.2) dort erscheinen, wo 
der in adverbialer Funktion unflektierte Positiv des entsprechenden Adjek- 
tivs erscheint. In Anbetracht der adverbierenden Funktion des produktiven 
-stens-Suffixes liegt es nahe, auch im Falle des produktiv adverbialen Gebrauch 
anzeigenden unflektierten Positivs ein adverbierendes, allerdings unsichtbares 
Morphem anzusetzen, d.h., von Konversion und entsprechend einer Kategorie 
„Adjektivadverb“ auszugehen (s.o. Abschnitt 1.2 und unten Abschnitt 5.3).°° 

Wir gehen davon aus, dass Ausdrücke, die graduierbare Eigenschaften 
bezeichnen, Relationen zwischen zu vergleichenden Entitäten kodieren (s. 
Abschnitt 1.2). Die erste Stelle ist je durch das KoMPARANDUM bzw. den durch 
es instantiierten Grad der relevanten Eigenschaft besetzt; die zweite Stelle durch 
einen VERGLEICHSSTANDARD, der je nach Steigerungsstufe unterschiedlich reali- 
siert werden kann (vgl. Tab. 3). 


Tabelle 3: KomparAanpA Und VERGLEICHSSTANDARDS der Steigerungsstufen. 


KoMPARANDUM VERGLEICHSSTANDARD 
Positiv Ben ist/läuft (so) schnell { Ø, für ein Kind, wie Ben } 
Komparativ Ben ist/läuft schneller als Bo 
Superlativ Ben ist/läuft am schnellsten Ø 


An verschiedenen Stellen haben wir Evidenz dafür gesehen, dass Adverbierung 
damit zu tun hat, aus relationalen Ausdrücken einstellige Ausdrücke zu machen 
(vgl. die Abschnitte 1.2, 1.3, 4.1). Im Fall von Superlativen spricht viel dafür, dass 
der VERGLEICHSSTANDARD implizit durch Allquantifikation gebunden wird. Ers- 
tens sind Superlative oberflächlich betrachtet einstellige Prädikationen, deren 
VERGLEICHSSTANDARD sich nicht unabhängig realisieren lässt: 


32 Vgl. unten Abschnitt 5.3 und Paul (1920: 110): 

Zu dem Adjektivum mittel hat man, weil darin etwas Vergleichendes liegt, einen 
an sich unnötigen Komparativ und Superlativ mittlere, mittelste gebildet; diese 
Formen haben allmählich den Positiv ganz verdrängt [...]. 

33 Mittelste ist heute allerdings unüblich; mittlere verhält sich synchron wie die loka- 
len Adjektive mit stammhaftem Ausgang -er, der auch bei Superlativierung erhalten 
bleibt (oberste, vorderste etc.); es handelt sich also synchron nicht mehr um Kompara- 
tive. 
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(33) Ben ist am schnellsten (“als/wie Bo) / (“für ein Kind). 


Zweitens gibt es auch sprachübergreifend einen engen Zusammenhang zwi- 
schen Superlativierung und Allquantifikation, indem Elemente wie all in eini- 
gen Sprachen die Basis für Superlativmorphologie abgeben bzw. in Kombination 
mit Komparativmorphologie Superlative bilden.** Im Deutschen lässt sich das 
Element aller ohne Änderung der wahrheitsfunktionalen Bedeutung rekursiv 
mit superlativischen Formen verknüpfen, was darauf hindeutet, dass Allquanti- 
fikation in Superlativen schon anderweitig kodiert ist (Ben ist am (aller(aller...)) 
schnellsten). Drittens machen Superlative ihr Argument analog zu allquantifi- 
zierenden Ausdrücken zu monoton fallenden Umgebungen, die negative polare 
Elemente wie deutsch je lizensieren: 


(34) Der große Plan, lehrte Noam Chomsky, er existiere wirklich, und alle 
vorhandenen Sprachen, alles, was je gesagt und geschrieben wurde, sei 
nur die Aktualisierung eines immer schon vorhandenen Wissens [...]. 
(Süddeutsche Zeitung, 6.12.2008, o. S.) 


(35) Auschwitz war das Niedrigste, was je der Mensch dem Menschen angetan 
hat. (Nürnberger Zeitung, 28.1.2005, o. S.) 


Superlativische Formen sind womöglich deshalb zur Adverbierung prädesti- 
niert, weil die entscheidende Sättigung der internen Argumentstelle ihre Gestalt 
schon qua Allquantifikation definiert. Es kommt hinzu, dass nicht-attributiv 
verwendete Superlative durch Präpositionen lizenziert werden müssen, die 
auch als Ausgangsmaterial für das im Bereich des Adverbs allgegenwärtige -s 
fungieren (Abschnitt 3.1.2). Nicht zuletzt ist Superlativierung bzw. Elativierung 
bei -stens Formen im semantischen Sinne weit(est)gehend harmlos, was, wie 
in anderen Bereichen beobachtet, zu ihrer Produktivität beitragen mag (vgl. 
Abschnitte 3.3, 4.1). 


5.2 Harmonisches Zusammenrücken: zu, all, -st(ens) 


Die Präposition zu wirkt in Richtung der Adverbierung mit Formen zusam- 
men, die universale Quantifikation ausdrücken - dazu gehören das Element all 
bzw. aller und das Superlativsuffix -st (s. oben Abschnitt 4.2). Im Bereich der 


34 So z.B. im Lettischen, Estonischen oder Amharischen, vgl. Heine & Kuteva (2001: 
36-37). Vgl. zur Analyse von Superlativen als Komparative mit allquantifiziertem 
VERGLEICHSSTANDARD auch Ultan (1972), Heine (1997: 124) sowie Bobalijk (2012: 61). 
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Adverbbildungen mit Präpositionen konstatieren wir neben dem Bestehen 
eines ‚morphologischen‘ Typs mit Letztgliedern und Proformen (hinten(he)rum, 
mitten(hin)durch, vgl. oben Abschnitt 4.1) einen alternativen ‚syntaktischen‘ 
Weg der Sättigung bzw. Bindung der internen Argumentstelle durch (universale) 
Quantifikation (zu(aller)erst, s.u.). 

zu und - in geringerem Maße - vor kommen verglichen mit den anderen 
Präpositionen signifikant häufiger als Erstglieder vor (Abschnitt 4.2) und Super- 
lative geben eventuell deshalb einen besonders brauchbaren Rohstoff für Adver- 
bien ab, weil ihr internes Argument implizit quantifiziert ist. Besonders die Mög- 
lichkeiten, superlativische Formen alternativ durch Voranstellung von zu, durch 
Ersetzung einer Präposition durch suffigiertes -s oder auch stillschweigend zu 
adverbieren sowie rekursiv und damit beliebig oft das quantifizierende Element 
aller einzubetten, tragen zu Typenreichtum und Produktivität superlativischer 
Adverbien bei, vgl. die Übersicht der Bildungsmöglichkeiten anhand einschlägi- 
ger Formen aus ADVERBIEN_1 in Tab. 4.*° 


Tabelle 4: Bildungen mit Superlativformen, zu-, -aller- und -ens. 


Grundform Ø zu- aller- | -ens | zu--ens 
meist v v v v v 

erst v v v v - 
mindest - v v v v 
höchst, letzt, tiefst - v v v - 
äußerst, hinterst, nächst, oberst, unterst, - v v - - 
vorderst 

best, feinst, genauest, schärfst, schlimmst, - - v v - 


schnellst, schönst, spätest, strengst, 
striktest, wärmst, wenigst 


Einbettung von aller ist ausnahmslos und sowohl in Kombination mit zu- wie 
auch mit -stens möglich. Vorangestelltes zu- und suffigiertes -s sind weitestge- 
hend in komplementärer Distribution, wie zu erwarten ist, wenn -s vorange- 
stellte Präpositionen ersetzt (vgl. Abschnitt 3.1.2). Ausnahmen bilden zumindes- 
tens mit 2.351 Belegen (gegenüber je ca. 700.000-mal zumindest und mindestens) 
sowie zumeistens mit zwei Belegen im Gesamtkorpus (gegenüber je ca. 100.000- 
mal zumeist und meistens). Möglicherweise werden die Grundformen hier nicht 


35 Die „nackten“ Formen höchst oder äußerst werden als Gradpartikeln gebraucht, die 
aufgrund der fehlenden Funktionsfähigkeit (reflektiert in alleinigem Auftreten im 
Vorfeld) aus der hier zugrundegelegten Definition von Adverb herausfallen. 
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Abbildung 4: Mosaikplot für (un)verbautes (a//)zu in apverBIEN_1 (X? = 48425, df = 1, p < 
2.2e-16, Phi = 0,36). Die Häufigkeitsverteilung wird durch Rechtecke visualisiert, deren 
Größe proportional zur Fallzahl ist. Rote Einfärbung bedeutet Unterrepräsentation, 
blaue Einfärbung Überrepräsentation des jeweiligen Falls. 


mehr als Superlative empfunden, wodurch die Bildungen auch aus dem Bereich 
der Regel rücken, die die mit phrasalen Superlativen verknüpften Präpositionen 
gegen -s tauscht. Stillschweigende Adverbierung der Superlativform ist nur in 
den Fällen möglich, die auch eindeutige Adverbierung durch vorangestelltes zu- 
oder durch suffigiertes -ens erlauben. Nicht enthalten sind - mit Ausnahme von 
erst - auf Ordinalzahlen basierende Typen, die wie Superlative das semantisches 
Merkmal „Einzigkeit“ tragen, dessen partielle Wiederholbarkeit durch aller für 
die beobachtete Variation wesentlich ist. 

Auch andere Wortbildungen - bzw. Umbauten zu Adverbien - weisen auf 
eine für die Adverbierung entscheidende Sonderbeziehung zwischen zu- und 
all- hin. Insbesondere wird die Form allzu, aber nicht zu allein, mit den durch 
sie modifizierten Adjektiven bzw. Adverbien nicht selten (in etwa 20 % der Fälle) 
zusammengeschrieben und mithin als eigenständige Bedeutungseinheit (d.h. 
Wort) empfunden. Abb. 4 visualisiert die Überrepräsentation von „unverbautem“ 
zu (großes Feld links oben) gegenüber der Überrepräsentation von „verbautem“ 
allzu (Feld rechts unten) für solche Fälle, in denen die Formen als Adverbierer 
konkurrieren." 


36 Dahinter stehen aus dem Gesamtkorpus extrahierte Kombinationen mit den For- 
men sehr, oft, weit, lange, gern(e), gut, schnell sowie bald, die möglichst ausschließ- 
lich als Adverb fungieren; zu kommt „verbaut“ frequent in Kombination mit den 
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5.3 Wortbildung vs. Flexion 


Die Frage „Wortbildung oder Flexion“ präsentiert sich unter der hier gemachten 
Unterscheidung zwischen dem Bau von und dem Umbau zu Adverbien in ande- 
rem Licht: die formalen Parallelen zwischen bona-fide-Zusammenrückungen 
und superlativischen Adverbformen (vgl. oben 6 sowie 27 und 28) ebenso wie 
die Beobachtungen zu Univerbierung und nicht-attributiver (adverbialer) Ver- 
wendung im letzten Abschnitt sprechen dafür, dass es sich bei superlativischen 
Adverbien um Umbauten aus der Syntax handelt; die synchron produktive und 
eindeutig Adverbien markierende -stens Form (vgl. Abschnitte 3.1.2, 5.2) prä- 
sentiert sich als ein Derivationssuffix mit syntaktischer Geschichte. Den Über- 
gang von flexivischer Syntax zur Wortbildung bzw. die Durchmischung beider 
Ebenen markieren in Sonderheit die aus phrasal-präpositionalen Superlativen 
und stens-Adverbien bestehenden Reihen (z.B. am schnellsten - schnellstens): 
das -en- in den stens-Formen ist ein Überbleibsel aus der Syntax, das mit dem 
gegen eine es ursprünglich verantwortende Präposition getauschten -s zu -ens 
wird. 

Entlang traditioneller Einteilungen sprechen die hier erzielten Ergebnisse 
dafür, dass Superlativmorphologie eher in den Bereich der Wortbildung gehört, 
indem sie eine vitale Funktion bei der Adverbierung innehat. Klar zutage tritt 
dies bei durch Umbau aus adverbialen am ... -sten-Phrasen entstandene -stens 
Adverbien (vgl. die Abschnitte 3.1.2, 5.1). Für die Zugehörigkeit der Komparation 
zur Wortbildung spricht auch ihre Konkurrenz zur Derivationsmorphologie, die 
deutlich im Englischen zutage tritt (Zwicky 1989), wo Komparativsuffixe und das 
systematisch Adverbien markierende Suffix -ly nicht in ein und derselben Wort- 
bildung erscheinen (Zwicky 1989:139).”” In derselben Richtung lässt sich eine 
Tendenz beobachten, Superlativmorphologie fälschlich nach außen zu „schie- 
ben“ bzw. diese am rechten Wortrand zu wiederholen, sofern die entsprechende 


quantifizierenden Formen viel bzw. wenig als Partikel oder Pronomen vor. Die abso- 
luten Werte sind: 


allein verb. 


zu 313.735 931 
allzu 43.583 9.361 


37 In der Geschichte des Deutschen haben wie oben erwähnt (Abschnitt 3.1.2) ver- 
schiedene Lautwandel zum Zusammenfall der im adverbialen Gebrauch endungslos 
erscheinenden Adjektivendungen -is und -os mit den Komparativformen -ir und -or 
geführt, die im Mittelhochdeutschen zu -er werden, das regelmäßig adverbiale Funk- 
tion markiert (Wilmanns 1896: 607, vgl. Abschnitt 3.1.2). Zeugen dieser Entwicklung 
sind z.B. rein adverbiales eher (von air (airis), s.o.), leider und evtl. fürder (zu fort, vgl. 
engl. further) oder adverbial gebrauchte Komparativformen wie länger oder weiter. 
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Abbildung 5: Assoziationsplot für (nicht-)attributiven Gebrauch (un)korrekter Superlativ- 
formen in ApverBieN_1 (X? = 3751,4; df = 1; p < 2,2e-16, Phi = 0,24). Siehe für Erläuterun- 
gen Abb. 3. 


Form adverbial verwendet wird. Wahrend attributiver und nicht-attributiver 
Gebrauch der korrekten Formen etwa ausgeglichen ist, ist der nicht-attributive, 
zumeist klar adverbiale Gebrauch „falscher“ Formen wie weitmöglichst oder 
bestmöglichst mehr als zehnmal (13,45x) so hoch wie ihr attributiver Gebrauch. 
Der Assoziationsplot in Abb. 5 zeigt, dass mit inkorrekter st-Suffigierung eine 
Verschiebung hin zum nicht-attributiven Gebrauch einhergeht.** 


38 Der Vergleich basiert auf einer Liste der 20 häufigsten Adverbien auf -lichst aus 
KoGraUK gesamt. Ausgewählt wurden diejenigen adjektivischen Basen, für die es 
eine ‚falsche‘ und eine ‚korrekte‘ Superlativform gibt: baldmöglichst (vs. baldestmög- 
lich), schnellstmöglichst (vs. schnellstmöglich), bestmöglichst (vs. bestmöglich), rasch- 
möglichst (vs. raschestmöglich), weitmöglichst (vs. weitestmöglich). Die absoluten 
Werte sind: 


ADJA -ADJA 


* 


-st 477 6.414 
korrekt 25.592 30.774 
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5.4 Zusammenfassung 


Das Gros der Adverbien im Deutschen - 94% der Typen in ADVERBIEN_1 - fällt 

formal in 29 Klassen, die sich neben Simplizia zu drei Oberklassen bündeln 

lassen: Adverbien mit flexivischen Endungen, Adverbien mit präpositionalen 

Bestandteilen und Adverbien mit aus Substantiven gebildeten Suffixen. Die ers- 

ten beiden Oberklassen und Beziehungen zwischen ihnen standen hier im Fokus; 

ein zentrales Ergebnis ist, dass es im Deutschen einen Grammatikalisierungs- 
prozess gibt, in dem die Präpositionen in/im, an/am und zu/zum eliminiert und 
durch suffigiertes -s ersetzt werden. 

Relationalität ist eine grundlegende Bedingung für das Ausgangsmaterial, 
aus dem Adverbien gebaut werden. Im Zuge der Adverbierung wird das interne 
(PATIENS-, VERGLEICHSSTANDARD-, Objekt-)Argument gesättigt bzw. gebun- 
den und das externe (AGENS-, KOMPARANDUM-, Subjekt-)Argument zu Gesche- 
hen verschoben. Partizipien I und Superlative sind qua Bedeutung und der sie 
kodierenden Struktur besonders gut als Adverbien brauchbar: Partizipien I 
beziehen sich auf externe AGENS-Argumente, die eng an Geschehen geknüpft 
sind (Abschnitte 1.3, 3.3). Superlative beziehen sich auf KoMPARANDA, interne 
KoMPARATA werden hier per Allquantifikation gebunden (Abschnitt 5.1). 

Innerhalb der Wortbildungen mit primären Präpositionen, die in der Syn- 
tax prototypische adverbiale Relatoren sind, gibt es wesentliche Unterschiede in 
syntaktischer und semantischer Dimension (vgl. Abschnitt 4): 

- Die Pro-Adverbien da, hier, wo sowie hin und her sättigen die interne Argu- 
mentstelle bei Wortbildungen mit Präpositionen in Letztstellung und leiten 
so Adverbien ab. 

- Präpositionen wie durch oder mit sind „näher“ an Eigenschaften (und mithin 
Adverbien), Präpositionen wie um „näher“ an Relationen; einiges spricht da- 
für, dass z.B. adverbiales durch eine stille Proform enthält. 

- Wortbildungen mit den Erstgliedern zu und vorhaben syntaktische Züge und 
eröffnen die Möglichkeit der Rekursion. Allquantifikation wie an Superla- 
tivformen geknüpft bindet die interne Argumentstelle in Bildungen mit zu-. 


39 Bezüglich der in Abschnitt 1.1 angerissenen Grundsatzproblematik scheint das Beste- 
hen von Mechanismen der Adverbierung bzw. von Mustern des Adverb-seins, die 
Kategorien und Bedeutungsbereiche übergreifen (viz. Reduktion der internen Stelle 
bestimmter Relationen), für einen lexembasierten Ansatz zu sprechen. Die Beob- 
achtungen um Adverbbildung mittels -stens und - in möglicher Verlängerung - die 
Adverbableitung aus positiven Adjektiven mittels Nullmorphem, also Konversion, 
sprechen dagegen eher für morphem- bzw. wurzelbasierte Ansätze („distribuierte 
Morphologie‘). 
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An verschiedenen Stellen finden sich Hinweise auf einen Zusammenhang 
zwischen semantischer Schwäche und Produktivität: Semantisch harmonie- 
rende Elemente rücken produktiv zu Wörtern zusammen (Abschnitt 5.2) und 
redundante bzw. semantisch harmlose Operationen sind besonders produktiv 
(Abschnitte 3.3, 4.1, 5.1). 
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Starke vs. schwache Flexion 
aufeinanderfolgender attributiver 


Adjektive: mit hohem technischen/ 
technischem Aufwand 


Abstract Usually, weak inflection of an attributive or nominalized adjective 
occurs if the adjective is preceded by an inflected determiner: mit diesem tech- 
nischen Aufwand (‘at great technical expense’). Otherwise, the inflection of the 
adjective is strong: mit technischem Aufwand. Following this rule of thumb, we 
would expect strong inflection of an adjective following another adjective when- 
ever the determiner is missing: mit hohem technischem Aufwand. But many 
German speakers opt for a weak dative singular ending -en following the strong 
ending -em on the first adjective: mit hohem technischen Aufwand. This chapter 
shows which explanatory variables play a role in this variation within standard 
German. 


Keywords adjective inflection, strong inflection, weak inflection, Switzerland, 
Swiss, logistic regression 


Open Data Der Datensatz ATTRIBUTIVE_ADJEKTIVE_1 ist Öffentlich zugänglich 
und durchsuchbar in der Datenbank attributive Adjektive (DOI: 10.14618/ 
attributiveAdjektiveDB). 


1 Grundlagen 


Folgt ein attributives oder nominalisiertes Adjektiv (Partizip) auf einen Determi- 

nierer mit Flexionsendung, wird es schwach dekliniert, sonst stark: mit diesem 

technischen Aufwand, aber mit technischem Aufwand. Abweichungen von die- 

sem Prinzip finden sich bei 

- maskulinen und neutralen Adjektiven im Dativ Singular: Die starke Flexions- 
endung -(e)m kann nicht nur dann schwache Flexion an folgenden Adjekti- 
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ven auslösen, wenn sie am Determinierer zu finden ist (mit diesem techni- 
schen Aufwand), sondern auch als Flexionsendung eines typischen Adjektivs 
(mit hohem technischen Aufwand). Weil die beiden Adjektive unterschiedlich 
flektieren, sprechen wir von Wechselflexion. Im Gegensatz dazu steht die 
Parallelflexion, bei der beide Adjektive gleich flektieren: mit hohem techni- 
schem Aufwand. 

Adjektiven, die auf Pronominaladjektive' (z.B. beid-, einig-, solch-) folgen: 
Pronominaladjektive haben Eigenschaften sowohl von Determinierern als 
auch von typischen Adjektiven. Entsprechend findet sich die Variation mit 
solcher vom Gemeinderat gewollten vs. gewollter Verkehrskanalisierung. Im 
Dativ Singular Maskulinum/Neutrum findet sich besonders viel schwache 
Flexion. Diese Variation betrifft aber auch alle anderen Merkmalskombina- 
tionen, bei denen starke von schwachen Endungen unterschieden werden 
können, wie etwa hier den Dativ Femininum Singular. 

maskulinen und neutralen Adjektiven im Genitiv Singular: Die starke En- 
dung -es gibt es noch bei Determinierern (unseres Schrebergartens), aber bei 
typischen Adjektiven ist sie untergegangen (aufgrund schlechten Wetters). 
Bei den Determinierern gibt es Schwankungsfälle (dieses/diesen Jahres). 
Adjektiven nach deren und dessen: Traditionell lösen diese Wörter keine 
schwache Flexion am folgenden Adjektiv aus: mit deren famoser Idee, für des- 
sen famose Ideen. Vereinzelt kommt aber auch schwache Flexion vor, wohl 
weil die Formen deren und dessen flektierten Determinierern ähneln: mit de- 
ren famosen Idee, für dessen famosen Ideen. Hochinteressant, aber nicht The- 
ma dieses Kapitels ist die Frage, ob auch hier der Dativ Singular Maskulinum/ 
Neutrum besonders stark betroffen ist, vgl. zu deren eigenen Schutz (Freie 
Presse, Beispiel aus Zweifelsfälleduden 2016: 225). 


Welche Eigenheiten der starken dativischen Endung -(e)m dazu führen, dass 


sie in bestimmten Kontexten durch die schwache Endung -(e)n ersetzt werden 


kann, ist nicht abschließend geklärt (Überblick in Gallmann 2016). Für andere 


starke Endungen gilt das nicht analog, der Sprachwandel scheint zumindest 


bei Adjektiven nach Pronominaladjektiven in entgegengesetzter Richtung zu 


verlaufen (Bildhauer et. al. 2019: 308): älter sämtlicher verwendeten Materia- 


lien (schwach), neuer sämtlicher verwendeter Materialien (stark). Insofern lohnt 


der Sprachberatungsklassiker „-m oder -n“ (vgl. z.B. Kubczak 2015, Zwei- 


felsfälleduden 2016: 29, Grammatikfragen 2018) weitere wissenschaftliche 


Beobachtungen. 


1 


Zum Terminus Pronominaladjektiv vgl. Wiese (2009: 167). 
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2 Fragestellung 


Im Folgenden sollen die Bedingungen, unter denen Wechselflexion im Dativ Sin- 

gular Maskulinum/Neutrum wahrscheinlich wird, näher beschrieben werden. Bei 

der Variation vom Typ hohem technischem/technischen Aufwand sind in der bis- 

herigen Forschung unter anderem folgende Einflussgrößen untersucht worden: 

- interne Struktur der NP (z.B. Moulin 2000), und-Test (z.B. Heynatz 1770: 96 = 
Dritter Theil Nr. 40) 

- Interpunktion (z.B. Moulin 2000) 

- semantische Klassen der Adjektive (z.B. Nübling 2011) 

- Genus des Substantivs (z.B. Nübling 2011) 

- Rektionstyp (der Kasus der NP wird von einer Präposition regiert oder nicht; 
Sahel 2011) 

- phonologische Merkmale wie /m/ in der Mitte/am Ende des Substantivs 
(Niebuhr 2017) 

- Frequenz der beiden Adjektive (Schafer 2017) 

- Land (Peter 2013) 

- Jahr (Peter 2013) 


Mehrere Einflussgrößen in Kombination berücksichtigt Schafer (2017), allerdings 
anders als im vorliegenden Kapitel auf der Basis von Internetkorpora. Auch uns 
geht es um das Zusammenspiel von Einflussgrößen. Schließlich soll die Frage, 
welche Einflussgrößen besonders stark wirken, beantwortet werden. 
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Die hier dargestellten Ergebnisse beziehen sich auf zwei unterschiedlich große 
Datensätze. Den kleineren Datensatz, ATTRIBUTIVE_ADJEKTIVE_1, haben wir aus 
einem Ausschnitt des Untersuchungskorpus von 122 Millionen Tokens erzeugt. 
Er enthält nach dem Aussortieren von Fehlbelegen 1.598 Belege und war damit 
klein genug, um komplett von Hand annotiert zu werden. In der „Datenbank 
attributive Adjektive“ (Münzberg et al. 2018) kann dieser Datensatz durchsucht 
werden. 
Die folgende Suchanfrage wurde gestellt: 


Ø Ø Ø zweites 
erstes Ad- Adjektiv 
Präposition Adverb jektiv mit l Adverb mit Endung | Nomen 
Endung -em -em oder 
-en 


Abbildung 1: Suchmuster für Adjektivflexion im Datensatz aTTRIBUTIVE_ADJEKTIVE_1. 


102 — Starke vs. schwache Flexion aufeinanderfolgender attributiver Adjektive 


Präpositionalphrasen, die diesem Muster entsprechen würden, sind etwa: 


(1) a. mit ziemlich langem, beinahe schwarzem/schwarzen Haar 
b. mit ziemlich langem schwarzem/schwarzen Haar 
c. mit langem, schwarzem/schwarzen Haar 
d. mit langem schwarzem/schwarzen Haar 


Der größere der beiden Datensätze, ATTRIBUTIVE_ADJEKTIVE_2, umfasst nach 
dem Aussortieren von Fehlbelegen 119.376 Belege. Gesucht wurde im Untersu- 
chungskorpus nach dem Muster: 


© 


und 

bzw. 
beziehungsweise 
erstes Adjektiv , aber 

mit Endung -em | , doch 

, also 

d.h. 

d.h. 

das heißt 

, und zwar 


zweites Adjektiv 
mit Endung -em | Nomen 
oder -en 


Präposition 


Abbildung 2: Suchmuster für Adjektivflexion im Datensatz ATTRIBUTIVE_ADJEKTIVE_2. 


Präpositionalphrasen, die diesem Muster entsprechen würden, sind etwa: 


(2) a. mit langem und schwarzem/schwarzen Haar 
b. mit langem, schwarzem/schwarzen Haar 
c. mit langem schwarzem/schwarzen Haar 


Dieser größere Datensatz ermöglicht die Untersuchung syndetischer Koor- 
dination und eine Darstellung der regionalen Verteilung sowie der zeitlichen 
Entwicklung. 

Die nachträgliche Belegannotation umfasste in beiden Datensätzen die fol- 
genden Einflussgrößen, die in Abschnitt 4.ı bis 4.3 näher erläutert werden: 
- Frequenz des ersten und des zweiten Adjektivs 
- Silbenzahl des ersten und des zweiten Adjektivs 
- /m/ am Ende des Substantivs 
- /m/ in der Mitte des Substantivs 


Nur der Datensatz ATTRIBUTIVE_ADJEKTIVE_1 enthält Belegannotationen von 
Hand nach den Prädiktoren 
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- Genus des Substantivs 

- Wortbildung der Adjektive (Partizip - lexikalisiertes Partizip - kein Partizip) 

- semantische Klasse der Adjektive (11-Klassen-System) 

- semantische Klasse der Adjektive (2-Klassen-System: intersektiv und nicht 
intersektiv) 

- und-Test-Ergebnis 


sowie die im Suchergebnis (vgl. Abb. ı) vorhandenen Werte für die Variablen 
- Komma zwischen den beiden Adjektiven JA/NEIN 

- Adverb vor erstem Adjektiv JA/NEIN 

- Adverb vor zweitem Adjektiv JA/NEIN 


und die nachträglich automatisch annotierte Information 

- Wahrscheinlichkeit dafür, dass ein Adjektiv attributiv zu einem gegebenen 
Substantiv auftritt (= P(Adj|N), im Weiteren „substantivspezifische Adjektiv- 
frequenz“; vgl. fürs Englische Wulff 2003: 267: „noun-specific frequency“) 


Bei diesen Einflussgrößen stand die Frage im Vordergrund, ob semantisch- 
syntaktische Prädiktoren wie Komma JA/NEIN und semantische Klasse der 
Adjektive einen stärkeren oder einen schwächeren Effekt auf die abhängige 
Variable Flexion STARK/SCHWACH haben als phonologische Prädiktoren wie Sil- 
benzahl und /m/ am Ende des Substantivs - oder ob nicht beides durch Fre- 
quenzeffekte ausgehebelt wird. Für den kleinen Datensatz haben wir mehrere 
logistische Regressionsmodelle spezifiziert. Am Ende eines Selektionsprozesses 
stand ein Regressionsmodell mit den folgenden Prädiktoren (die Modellspezifi- 
kation ist im Anhang dargestellt): 

- Frequenz des ersten Adjektivs 

- Silbenzahl des zweiten Adjektivs 

- /m/ am Ende des Substantivs 

- /m/ in der Mitte des Substantivs 

- semantische Klasse (11-Klassen-System) des zweiten Adjektivs 

- Komma JA/NEIN 

- und-Test-Ergebnis 

- substantivspezifische Adjektivfrequenz des zweiten Adjektivs 

- Land 


Um die Effektstärken besser miteinander vergleichen und visualisieren zu kön- 
nen, wurden auf dem kleinen Datensatz ATTRIBUTIVE_ADJEKTIVE_1 mit binär 
umkodierten Faktoren Koeffizienten geschätzt (s. Abschnitt 5). 

Die Regressionsanalyse für den großen Datensatz ATTRIBUTIVE_ADJEKTIVE_2 
umfasst folgende Prädiktoren (die Modellspezifikation ist im Anhang dargestellt): 
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- Frequenz des ersten Adjektivs 

- Silbenzahl des zweiten Adjektivs 

- /m/ am Ende des Substantivs 

- /m/ in der Mitte des Substantivs 

- Koordinationsmarker wie Komma oder Konjunktion oder kein Koordinations- 
marker 

- Land 

- Jahr 


- inhaltliche Domäne 


Ergänzt wurden die logistischen Regressionen durch visuelle Überprüfungen 
von Teilen des großen Datensatzes mithilfe von Assoziationsplots, die auf Chi- 
Quadrat-Analysen basieren (vgl. Zeileis et al. 2007). 


4 Ergebnisse der Korpusuntersuchung 


Im Folgenden werden die Wirkungen der einzelnen Einflussgrößen beschrieben. 
Die genauen Kennzahlen zu den Regressionsanalysen sind im Anhang dargestellt. 
Einen Überblick über die Variation im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 gibt 
Abb. 7 (Abschnitt 5). 

Viele, aber nicht alle Hypothesen aus der Literatur sind in die Untersuchung 
eingeflossen. Nach Sahel (2005: 364-365) ist zu erwarten, dass das zweite Adjek- 
tiv bei der Rektion der Nominalgruppe durch eine Präposition eher stark flek- 
tiert wird als bei anderen Rektionstypen. In der Tat kann in einer Regressions- 
analyse bei Adjektiven nach Pronominaladjektiven ein schwacher Einfluss in 
diese Richtung nachgewiesen werden. Dies zeigte sich im Rahmen der Arbeiten 
an Bildhauer et al. (2019). Da artikellose Nominalphrasen im Dativ Singular Neu- 
trum oder Maskulinum ohnehin meist nach Präposition vorkommen, wenn nicht 
gerade das erste Adjektiv ein Pronominaladjektiv ist, haben wir diesen Faktor in 
der vorliegenden Untersuchung konstant gehalten: Alle ersten Adjektive folgen 
auf eine Präposition. 
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4.1 Syntaktische und semantische Einflussgrößen 


4.1.1 Möglichkeiten, auf die interne Struktur der Nominalphrase 
zu schließen 


Wenn vor einem artikellosen Nomen mehr als ein attributives Adjektiv (Partizip) 
steht, sind vor allem drei unterschiedliche Strukturen denkbar (dazu und zu wei- 
teren Analysemöglichkeiten vgl. Eisenberg 2013: Bd. 2, 391). Für die erste dieser 
drei Strukturen, die gereihte Struktur, steht Beispiel (3): 


(3) zu offenem und offensivem Dialog (Süddeutsche Zeitung, 30.10.2006, S. 11) 


Jedes der beiden Adjektive modifiziert dasselbe Nomen. In diesem ersten Fall 
kann man sich vorstellen, dass es zwei Prädikationen über das vom Nomen 
Bezeichnete gibt: Ein „offener und offensiver Dialog“ ist ein Dialog, der sowohl 
offen als auch offensiv ist. Bei dieser Variante kann die Konjunktion und durch 
Komma ersetzt werden: ein offener, offensiver Dialog. Eine seltenere Variante 
dieser Struktur ist die Geminatio, eine rhetorische Figur, die der Intensivierung 
dient: Das Adjektiv wird wiederholt. In diesem Sonderfall gibt es nur eine Prädi- 
kation; Komma und Konjunktion sind nicht austauschbar: 


(4) mit großem, großem Engagement (Rhein-Zeitung, 31.5.2011, S. 6) 


Ebenso wenig austauschbar sind Konjunktion und Komma in elliptischen? Struk- 
turen, die wir ebenfalls zu den gereihten Strukturen rechnen (5). 


2 Bei unserer Definition der Koordinationsellipse halten wir uns an Hennig (2015: 
58): „Es müssen zwei bis auf eine Konstituente gleichen Typs identische Strukturen 
gleichen Typs koordiniert sein; die identischen Teile werden bei einem der beiden 
Vorkommen weggelassen. Der gleiche Typ ist hier: Nominalphrase mit attributivem 
Adjektiv (privatem Leben, beruflichem Leben). Der identische Teil ist Leben. Es liegt 
also nach Hennigs Klassifikation eine „Ellipse des Bezugsnomens“ (Hennig 2015: 59) 
vor; vgl. Dudengrammatik (2016: 909): „(c) [Die rote _] und [die schwarze Katze] 
schlafen“ Es ist nicht immer leicht, solche Strukturen abzugrenzen von Struktu- 
ren mit koordinierten attributiven Adjektiven wie in Die satte und zufriedene Katze 
schläft. In die Interpretation gehen sowohl die Semantik der Adjektive (Antonymie 
spricht für Ellipse) als auch die Semantik des Bezugsnomens ein (ein Lexem wie 
Balance oder Pol spricht für Ellipse). Entscheidend ist u.E., ob nach der semantischen 
Interpretation eine Referenz auf eine einzige Entität (ein Wesen, ein Ding, z.B. eine 
Katze) oder eine Referenz auf zwei verschiedene Entitäten (z.B. zwei Katzen, eine 
rote und eine schwarze) vermutet wird; vgl. Dudengrammatik (2016: 913) sowie 4.1.4. 
Bei Abstrakta wie Leben ist diese Entscheidung schwieriger als bei Konkreta; als 
Paraphrase mag hier dienen: zwischen Privatleben und Berufsleben (jeder hat nur ein 
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(5) die Balance zwischen privatem [hinzuzudenken: Leben] und beruflichem 
Leben (Angela Merkel, Ansprache zur Verabschiedung von Edmund Stoi- 
ber, 2007) 


Die zweite denkbare Struktur, die gestufte, zeigt Beispiel (6): 
(6) mit riesigem technischen Aufwand (Der Prignitzer, 17.7.2013, S. 23) 


Das zweite Adjektiv modifiziert das Nomen, das erste Adjektiv (riesigem) modi- 
fiziert nicht direkt das Nomen, sondern die gesamte folgende Gruppe aus zwei- 
tem Adjektiv und Nomen (technischen Aufwand). Die entsprechende Prädika- 
tion wäre also ‚Der technische Aufwand ist riesig‘. Von dieser zweiten Struktur 
wird seit dem 18. Jh. immer wieder vermutet, dass sie eher als die erste Struk- 
tur schwache Flexion am zweiten Adjektiv auslöst: „Wenn zwei Beywörter 
ohne Geschlechtswort, zwischen welchen kein und ausgelassen ist, vor einem 
Hauptworte stehen, so gehen sie so: [...] schönem rothen Weine. [...] schöner 
rothen Weine. [...] schönem grünen Grase“ (Heynatz 1803°/2006 159 = Wort- 
forschung Nr. 50) (vgl. auch Behaghel 1923: 212-214 sowie den hier untersuch- 
ten Faktor und-Test-Ergebnis). Wie man an dem Beispiel für den Genitiv Plural 
sieht, beschränkt sich die schwache Flexion zu dieser Zeit noch nicht auf den 
Dativ Singular Maskulinum/Neutrum. Nur die Unterscheidung zwischen gereih- 
ter und gestufter Struktur ist bereits wirksam - jedenfalls nach Heynatz (1770: 
96, 1803/2006 159). Behaghel (1923: 212-214) zeigt allerdings auch ältere Belege 
für Wechselflexion im Dativ Singular Maskulinum/Neutrum unabhängig von 
der Struktur. Auch zieht Adelung (1782: 634) die Wechselflexion in allen obli- 
quen Kasus vor, ebenfalls unabhängig von der syntaktischen Struktur. Beides 
legt nahe, dass der Zusammenhang zwischen Struktur der Nominalphrase und 
Flexion tatsächlich erst spät entdeckt oder konstruiert (vgl. Moulin 2000: 88) 
worden ist. Dazu und zum zeitweiligen Überwiegen der schwachen Flexion im 
17./18. Jh. vgl. den Überblick in Peter (2013: 188). 
Für Beispiel (7) nehmen wir eine dritte Struktur an: 


(7) in angemessenem, das heißt raschem Tempo (Kleine Zeitung, 10.1.1998, 
o. S.) 


Leben und trotzdem haben viele Menschen erstens ein Privatleben und zweitens ein 
Berufsleben). 

3 Der und-Test wird bereits in der ersten Auflage (Heynatz 1770: 96 = Dritter Theil 
Nr. 40) unter der Flexionstabelle erwähnt. 
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Das zweite Adjektiv modifiziert eingrenzend oder paraphrasierend das erste 
Adjektiv. Das kann explizit gemacht werden etwa durch und zwar, nämlich, 
genauer gesagt, das heißt. Das zweite Adjektiv kann aber auch einen Oberbegriff 
zum ersten Adjektiv bezeichnen. Explizit machen kann man das z.B. durch 
also oder das heißt. In beiden Fällen kann statt der expliziten Formulierung ein 
Komma stehen: 


(8) Zucker aus deutschem, europäischem Boden (Süddeutsche Zeitung, 
10.3.2010, S. 7) 


Fälle wie (7) und (8) werden bei unserem und-Test zusammengefasst (Wert 2, vgl. 
Abschnitt 4.1.3). 

In Nominalphrasen ohne explizite Koordination durch eine Konjunktion oder 
eine funktional vergleichbare Wortgruppe ist zu erwarten, dass die erste Struk- 
tur wie in (3) am häufigsten ist (vgl. Gallmann 2016: 9), am zweithäufigsten die 
zweite Struktur wie in (6) und am seltensten die dritte Struktur wie in (7). 

Korpuslinguistisch lassen sich die drei Strukturen schlecht voneinander 
unterscheiden. Deswegen wurde diese Unterscheidung auch nicht als Einfluss- 
größe in die statistischen Modelle aufgenommen. Es gibt aber eine exakt mess- 
bare Variable, die Interpunktion (s. Abschnitt 4.1.2), und den Heynatz’schen 
und-Test (s. Abschnitt 4.1.3), dessen Ergebnis sich als Variable operationalisieren 
lässt. Wir gehen davon aus, dass beide Variablen indirekte Rückschlüsse auf die 
interne Struktur der Nominalphrase erlauben. 


4.1.2 Interpunktion 


Nach § 71 (2) der amtlichen Rechtschreibregelung (Rat für deutsche Rechtschrei- 
bung 2018) zeigt ein Komma an, dass eine gereihte Struktur (3) gemeint ist, die 
beiden Adjektive also gleichrangig sind. Die Ergänzungsregel Eı legt noch ein- 
mal fest, dass ein Komma in der gestuften Struktur (6) falsch ist - verdeutlicht 
aber auch, dass es „gelegentlich“ (gemeint: wenn es die Semantik erlaubt) von 
der Äußerungsabsicht abhängt, ob ein Komma die zweite Struktur kennzeichnen 
soll. In mit langem[,] schwarzem Haar etwa wird beim Schreiben bestimmt, ob 
ein Komma angemessen ist: Beim Lesen kann man nicht beurteilen, ob ein Kom- 
mafehler gemacht wurde (vgl. Moulin 2000: 87). Bei mit neuen[,] umweltfreund- 
lichen Verfahren (so das Beispiel aus Eı) schließlich würde ein Komma anzeigen, 
dass ältere Verfahren nicht umweltfreundlich gewesen sind - hier kommt es also 
wieder auf die Äußerungsabsicht an, die korpuslinguistisch nicht ohne Weiteres 
erschlossen werden kann. Für die dritte Struktur (7) wird in § 71 der amtlichen 
Rechtschreibregelung nur auf $ 77 (4) verwiesen, der die Kommasetzung für 
Adjektivgruppen mit expliziter Konjunktion (also, das heißt, nämlich ...) regelt: 
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Unabhängig davon, in welcher Reihenfolge Ober- und Unterbegriff stehen, ist 
nur ein Komma zwischen den Adjektiven zu setzen und keines zwischen dem 
zweiten Adjektiv und dem Nomen. Zur Parallel- und Wechselflexion macht die 
amtliche Regelung keine Aussage. 

Im Ergebnis gleich ist die Dudenregelung, die vor der Rechtschreibreform 
gegolten hat (z.B. Rechtschreibduden 1991: 38). Die frühere Dudenregelung ist 
allerdings semantikbasiert und behandelt Semantik als etwas Objektivierbares 
(„hängt es vom Sinn des Satzes ab, ob ein Gesamtbegriff vorliegt oder nicht“). 
Wir gehen davon aus, dass beide zitierten Normen den Gebrauch professioneller 
Schreiberinnen und Schreiber möglichst genau abbilden sollen. 

Weil die Kommasetzung von der Äußerungsabsicht abhängig ist und weil 
natürlich trotz allen Bemühens um eine gebrauchsbasierte Regelung nicht gesagt 
ist, dass alle der offiziellen Regelung folgen wollen oder können, werten wir die 
Interpunktion nur als Indiz für eine mit gewisser Wahrscheinlichkeit intendierte 
Struktur der Nominalphrase. 

Adjektivreihungen mit Komma, die u.E. meist der ersten Struktur aus 
Abschnitt 4.1.1 entsprechen, weisen eher Parallelflexion auf: 


(9) Denn der Rückverweis an die streitenden Parteien ist der einzig mögliche 
Weg, um jeden Ruch des Staatsinterventionismus zu vermeiden — und mit 
sanftem, indirektem Druck diese leidige, politisch kontraproduktive 
Affäre beizulegen. (die tageszeitung, 22.4.2004, S. 11) 


Typisch für Strukturen ohne Komma (wir vermuten: mehrheitlich gestufte Struk- 
turen, also die zweite Strukturvariante aus Abschnitt 4.1.1) ist die Wechselflexion: 


(10) Das Gericht hat trotz fehlendem direkten Beweis keine Zweifel an der 
Schuld des Angeklagten. (Die Südostschweiz, 9.6.2012, S. 7) 


(11) Nach langem juristischen Tauziehen kam es zu einem Vergleich. (Die 
Rheinpfalz, 25.3.2013, o. S.) 


Parallelflexion kommt in dieser zweiten, nach amtlicher Regelung kommalosen 
Struktur ebenfalls vor, wenngleich seltener als Wechselflexion (zur Normdiskus- 
sion Nübling 2011: 178): 


(12) Die Ausweisung erfolgte nach langem juristischem Tauziehen (Berliner 
Zeitung, 21.6.2005, S. 1) 


Ambige Beispiele (13) - zwar mit Komma, aber mit schwacher Flexion - sind 
noch seltener (vgl. Tab. ı). 


4 Ergebnisse der Korpusuntersuchung — 109 


Tabelle 1: Ergebnisse aus dem großen Datensatz ATTRIBUTIvE_ADJEKTIVvE_ 2 zum Suchmuster 
Adjektiv auf -em - optionale Konjunktion (ggf. mit Komma) bzw. Komma - Adjektiv auf 
-em/-en - Nomen. (ADJ1: erstes Adjektiv, ADJ2: zweites Adjektiv.) 


Muster stark in% | schwach in% | gesamt 

ADJ1, also ADJ2 64 | 97% 2 3% 66 = 100 % 
ADJ1 bzw. ADJ2 205 | 95% 11 5% 216 = 100% 
ADJ1 und ADJ2 26.713 | 95% 1.546 5% | 28.259=100% 
ADJ1 beziehungsweise ADJ2 110 93% 8 7% 118 = 100% 
ADJ1, aber ADJ2 984 | 89% 121 11% 1.105 = 100 % 
ADJ1, ADJ2 15.423 | 79% 4.038 21% | 19.461 = 100% 
(Komma dazwischen) 

ADJ1 ADJ2 24.557 | 35% 45.675 65% | 70.232 = 100% 


(nichts dazwischen) 


(13) Es ist ein kühler Blick auf die Kulissen einer Unterhaltungs- und Freizeit- 
industrie, auf verlassene Orte in fahlem, bläulichen Licht. (Süddeutsche 
Zeitung, 26.8.2000, S. 21) 


Ein Komma erlaubt keine so deutliche Vorhersage der Parallelflexion wie die 
syndetische Koordination mit einer Konjunktion. In Tab. ı stellen wir Nominal- 
phrasen mit verschiedenen Konjunktionen (vgl. Meisner 2017), Nominalphra- 
sen mit bloem Komma und Nominalphrasen mit direkt aufeinanderfolgenden 
Adjektiven aus dem Datensatz ATTRIBUTIVE_ADJEKTIVE_2 einander gegenüber. 


4.1.3 Zusammenspiel zwischen und-Test-Ergebnis (möglicher 
Koordination) und Interpunktion 


Um die Merkmale der syntaktisch-semantischen Struktur quantifizierbar zu 
machen, haben wir den Datensatz ATTRIBUTIVE_ADJEKTIVE_1 von Hand nach- 
annotieren lassen. Dabei wurde versucht, anhand des und-Tests eine mögliche 
Koordination auszuschließen (s. Abschnitt 4.1.1; Heynatz 1803/2006: 159; Eisen- 
berg 2013: Bd. 2, 391). Es wurde jeweils getestet, ob sich zwischen die beiden 
Adjektive sinnvoll die Konjunktion und (und-Test-Wert ı, 396 Vorkommen) oder 
einer der Konnektoren also, d.h., nämlich (und-Test-Wert 2, 48 Vorkommen) 
oder nichts (und-Test-Wert 0, 1.153 Vorkommen) einfügen ließe. Tatsächlich ist 
bei möglichem und eine Tendenz in Richtung der starken Flexion nachweisbar. 
Beim selteneren Fall, dass also, d.h. oder Ähnliches eingefügt werden könnte, 
ist keine Tendenz feststellbar. Eine Geminatio trat nur einmal auf (mit großem, 
großem Engagement; Rhein-Zeitung, 31.5.2011, S. 6) und ging nicht in die Ana- 
lysen ein. 
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Diese Vorhersage ist aber nicht so gut wie die Vorhersage durch das Komma, 
was sich leicht erklären lässt: Gelingt der und-Test (Wert ı), ist Koordination 
zwar möglich - aber nicht unbedingt intendiert. Der einzige greifbare Ausdruck 
der Schreiberintention ist das Komma. Wenn der und-Test gelingt, das Komma 
aber fehlt, ist das ein Indiz dafür, dass eine gestufte Struktur gemeint war, auch 
wenn eine gereihte Struktur ebenfalls möglich gewesen wäre: 


(14) und-Test ı, kein Komma, schwache Flexion: 
a. in edlem zeitgemäßen Ambiente (Braunschweiger Zeitung, 5.7.2007, 
o. S.) 
b. mit kurzem grauen Bart (die tageszeitung, 22.2.2012, S. 5) 


(15) und-Test ı, kein Komma, starke Flexion: 
a. in ärmellosem rotem Cocktailkleid (die tageszeitung, 25.6.2008, S. 23) 
b. in weitem hügelumstelltem Tiefland (Victor Klemperer: Tagebücher 


1952, 1999, S. 348) 


Die Effektplots in Abb. 3 basieren auf einer Regressionsanalyse zum Datensatz 
ATTRIBUTIVE_ADJEKTIVE_1. Die Ergebnisse der Regressionsanalyse mit genauen 
Kennzahlen sind im Anhang dargestellt. Die beiden Plots veranschaulichen noch 
einmal, dass der Effekt der Interpunktion stärker ist als der des und-Test-Ergeb- 
nisses. Die Interpunktion erlaubt somit eine zuverlässigere Einschätzung als der 
und-Test. 
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Abbildung 3: Geschätzte Werte der Regressionsanalyse für schwache Flexion des 
zweiten Adjektivs je nachdem, ob sich zwischen die beiden Adjektive ein Koordinations- 
marker einfügen ließe (linker Plot, „und“ ist das und-Test-Ergebnis: 0 = kein Marker, 

1 = und, 2 = anderer Marker) und je nachdem, ob ein Komma zwischen den beiden 
Adjektiven steht oder nicht (rechter Plot; 0: kein Komma, 1: Komma). (Grundlage: 
Datensatz ATTRIBUTIVE_ADJEKTIVE_1.) Nach oben ist die Wahrscheinlichkeit für schwache 
Flexion des zweiten Adjektivs abgetragen (hoher Wert: hohe Wahrscheinlichkeit). 
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Darüber hinaus haben wir Korrelationen zwischen den verschiedenen Ein- 
flussfaktoren überprüft. Erwartungsgemäß gibt es eine starke Korrelation zwi- 
schen und-Test-Ergebnis und Interpunktion (vgl. Anhang, Abschnitt 6.2). 


4.1.4 Semantische Klassen der Adjektive 


Wie Nübling (2011: 186) zeigt, hängen die Möglichkeiten der Reihung oder aber 
der Stufung von den semantischen Klassen der Adjektive ab: Steht an zweiter 
Stelle ein Zugehörigkeitsadjektiv (Classificativum nach Eichinger 1991: 325) wie 
finanziell oder ärztlich, ist die gereihte Struktur unwahrscheinlich. Damit wären 
in unseren Daten erstens eine Korrelation zwischen und-Test-Ergebnis und 
semantischer Klasse und zweitens eine Korrelation zwischen Kommasetzung und 
semantischer Klasse zu erwarten gewesen. Diese beiden Korrelationen konnten 
jedoch im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 nicht nachgewiesen werden. 
Bei der Zuordnung von Lexemen zu semantischen Klassen gibt es immer Ent- 
scheidungen, die diskutiert werden und mit guten Gründen individuell unter- 
schiedlich ausfallen können. Unsere Einteilung ist eine Synthese aus Eichinger 

(1987), Eichinger (1991), Trost (2006), Nübling (2011) und Dudengrammatik 

(2016: 342-347). Die folgende Übersicht lehnt sich in der Terminologie und bei 

den Beispielen an die Dudengrammatik an: 

- Wörter, die nicht zwischen Artikel und Nomen passen, wie einige.‘ 

- „relationale Adjektive, die“ Demonstrativa ,nahestehen [...]: letztgenannte, 
besagte, obige, folgende“. Nicht prädikativ verwendbar. 

- „quantifizierende Adjektive, die“ Indefinita „nahestehen: [...] andere, sonstige, 
weitere, derartige“. Nicht oder schlecht prädikativ verwendbar. 

- „Ordinalzahladjektive: zweite, dritte, hundertste“; außerdem letzte. Nur als 
Nominalisierung prädikativ verwendbar. 

- „relationale Adjektive mit Bezug auf [die] räumliche Lage [...]: [...] dortige, 
linke“ (aber nicht ‚politisch links‘), „vordere, äußere“. Nicht oder schlecht prä- 
dikativ verwendbar. 

- relationale Adjektive mit Bezug auf die zeitliche Situierung: „damalige, heuti- 
ge, gestrige, morgendliche, diesjährige, einstige“, monatlich, täglich. Nicht oder 
schlecht prädikativ verwendbar. 

- „relationale Adjektive, die die stoffliche Beschaffenheit ausdrücken (und 
meist von Stoffsubstantiven abgeleitet sind): silbern, ledern, hölzern“ (strenger 
eingegrenzt als in Nübling 2011: 186). 

- „relationale Adjektive, die den Bereich [oder] die Zugehörigkeit [...] ange- 
ben [...]: steuerlich, schulisch“, technisch, wissenschaftlich, katholisch. Diese 


4 Das kommt im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 nicht vor, die morphologische 
Annotation war zuverlässig. 
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Adjektive sind in der aktuellen’ Lesart nicht oder schlecht prädikativ ver- 
wendbar und nicht oder schlecht steigerbar. Im Folgenden werden sie „Zu- 
gehörigkeitsadjektive (ohne solche, die die geografische Herkunft bezeich- 
nen)“ genannt. 

- Adjektive, die die geografische/politische Zugehörigkeit oder die Herkunft 
angeben und die typischerweise von Eigennamen abgeleitet sind: französisch, 
bayrisch. 

- qualifizierende Adjektive, die nach Trost (2006: 127) in die Klasse der refe- 
renziellen Adjektive rücken: stark in starke Raucherin oder neuin mein neues 
Auto, wenn es sich um einen Gebrauchtwagen handelt. Schlecht prädikativ 
verwendbar. 

- Farbadjektive; zusätzlich solche wie blond, hell, dunkel. 

- sonstige Adjektive, die in der aktuellen Lesart auch prädikativ verwendbar 
und in der Regel steigerbar sind: groß, hoch, schwer etc. Hier wurden insbe- 
sondere typische qualifizierende Adjektive eingeordnet. 


Die beiden Tests, die am häufigsten zur Abgrenzung der qualifizierenden Adjek- 
tive von den Mitgliedern anderer semantischer Klassen eingesetzt wurden, 
waren Steigerung und Einsatz als Prädikativ. 

Für die unterschiedlichen semantischen Klassen aus der vorangehenden Liste 
gelten verschiedene Wortstellungspräferenzen (s. Münzberg & Bildhauer in dieser 
Ausgabe). Fasst man diese Klassen wie Münzberg & Bildhauer (in dieser Ausgabe) 
zu sechs Wortstellungsklassen zusammen, so ergibt sich für jede Wortstellungs- 
klasse ein Wert zwischen ı (sehr weit rechts, also geringe Distanz zum Nomen) 
und 6 (am linken Rand, also große Distanz vom Nomen). Adjektive mit Wert ı 
(nahe am Nomen) sind in der Regel Substantivderivate, also „substantivverwandt“, 
Adjektive mit Wert 6 sind „den Artikelwörtern ähnlich“ (Eisenberg 2013: Bd. 2, 
393-394). Wenn man nun den Distanzwert des ersten Adjektivs vom Distanzwert 
des zweiten Adjektivs abzieht, erhält man einen Wert für den Unterschied in der 
Nomennähe. Für sich betrachtet, ist dieser Unterschied signifikant für die Flexion 
des zweiten Adjektivs: Gehören beide Adjektive derselben Distanzklasse an (Dis- 
tanzwert o), wird das zweite Adjektiv eher stark flektiert. Schwache Flexion ist 
wahrscheinlicher bei der erwartbaren Reihenfolge von Adjektiven unterschied- 
licher Distanzklassen (positiver Distanzwert). Wir haben den Einflussfaktor in 


5 technisch in technischer Aufwand ist ein Zugehörigkeitsadjektiv. technisch in Das Fuß- 
ballspiel dieser Mannschaft ist schneller, technischer und moderner geworden ist ein qua- 
lifizierendes Adjektiv. 

6 Überprüft anhand eines Chi-Quadrat-Tests und eines Assoziationsplots mit Darstel- 
lung der Pearson-Residuen; x2 = 147.66, df = 7, p < 0,001, Cramers V = 0,31 (nur Fle- 
xion und Distanzwert, ohne weitere Einflussfaktoren). 
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Tabelle 2: Semantische Klasse und Flexion des zweiten Adjektivs im Datensatz 
ATTRIBUTIVE_ADJEKTIVE_1 (* = ohne Adjektive, die eine geografische Herkunft bezeichnen; 
** = ohne Farbadjektive). 


Flexion des zweiten Adjektivs Zugehörigkeit* qualifizierend** 
schwach (-n) 483 = 62% 146 = 31% 
stark (-m) 292 = 38% 318 = 69 % 

775 = 100% 464 = 100% 


Tabelle 3: Interpunktion und Flexion bei Zugehörigkeitsadjektiven (ohne Adjektive, die 
eine geografische Herkunft bezeichnen). 


Flexion des zweiten Adjektivs mit Komma ohne Komma 

schwach (-n) 5= 10% 477 = 66% 

stark (-m) 45 = 90% 248 = 34% 
50 = 100% 725 = 100% 


Tabelle 4: Interpunktion und Flexion bei qualifizierenden Adjektiven (ohne Farbadjektive). 


Flexion des zweiten Adjektivs mit Komma ohne Komma 

schwach (-n) 47 = 17% 99 = 52% 

stark (-m) 228 = 83% 90 = 48% 
275 = 100% 189 = 100% 


einer logistischen Regressionsanalyse mit den anderen Prädiktoren überprüft und 
konnten keine signifikanten Einflüsse auf die Flexionsart feststellen. Die Modell- 
güte wurde durch die Aufnahme des Faktors nicht verbessert. Auch die semanti- 
sche Klasse des ersten Adjektivs als Prädiktor zeigt in einem logistischen Regres- 
sionsmodell keinen signifikanten Einfluss. Erwartet hatten wir mehr schwache 
Flexion nach Adjektiven, die Demonstrativa oder Indefinita nahestehen, so wie 
folgende oder andere; vgl. Bildhauer et. al. (2019). Für solche Adjektive gibt es aber 
im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 nur wenige Belege. 

Was die semantische Klasse des zweiten Adjektivs angeht, so entsprechen die 
Zahlenverhältnisse in unserem kleinen Datensatz der von Nübling (2011: 187) 
beschriebenen Tendenz, dass Zugehörigkeitsadjektive als zweite Adjektive eher 
schwach flektieren als qualifizierende Adjektive (Tab. 2). 

Sobald man aber die Interpunktion einbezieht, scheinen sich Zugehörigkeits- 
adjektive (Tab. 3) den qualifizierenden Adjektiven (Tab. 4) ähnlicher zu verhalten.’ 


7 Komma JA bei Zugehörigkeitsadjektiven tritt vor allem in den folgenden Fallgruppen 
auf: Zweifelsfälle bei der Annotation, Kommafehler (auf sicherem, rechtlichen Boden), 
und-Test mit Wert 2 (das zweite Adjektiv modifiziert das erste). 
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Verrechnet man semantische Klasse und Komma JA/NEIN in einer Regres- 
sionsanalyse mit weiteren grammatischen und außergrammatischen 
Einflussgrößen,? zeigt sich, dass im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 nicht 
Zugehörigkeitsadjektive, sondern Ordinalzahladjektive mit schwacher Flexion 
besonders hervorstechen. Auch für Farbadjektive ist schwache Flexion typisch 
(Tab. 7 im Anhang; ähnlich bei Nübling 2011: 188). Bei der Bewertung dieses 
Ergebnisses sollte allerdings nicht außer Acht gelassen werden, dass sie sich auf 
ein bestimmtes Korpus beziehen. Andere Korpora und andere Untersuchungs- 
methoden (etwa psycholinguistische) können zu anderen Ergebnissen führen, 
vgl. Schäfer (2017). 

Weitere semantische Feinheiten könnten eine Rolle spielen. So stellt Schäfer 
(2017) einen Einfluss der Präpositionen von und zwischen fest, verzichtet aber 
darauf, diesen Einfluss inhaltlich zu interpretieren. (Wir selbst konnten keinen 
Einfluss der lexikalischen Wahl der Präposition nachweisen). Der Versuch, den 
von Schäfer (2017) nachgewiesenen Einfluss vielleicht doch grammatisch zu 
erklären, hat uns auf eine neue Hypothese zum Muster Adjektiv + und + Adjek- 
tiv + Nomen gebracht: Vor allem bei der Präposition zwischen ist wahrscheinlich, 
dass die beiden Adjektive sich auf unterschiedliche Entitäten beziehen (zwischen 
roten und schwarzen Katzen unterscheiden). Das lässt auf eine Koordination von 
Nominalphrasen schließen, also auf eine elliptische Struktur, zu der ein Nomen 
hinzugedacht werden kann. Im Gegensatz dazu scheinen sich in Formulierungen 
wie bei sonnigem und trockenen Hochsommerwetter (dpa, 11.6.2006, o. S.) beide 
Adjektive gleichermaßen auf eine einzige Entität zu beziehen. Koordiniert wer- 
den zwei Adjektivphrasen. Unsere Hypothese ist: Wenn beide Adjektive sich auf 
eine einzige Entität beziehen (also keine Ellipse vorliegt), wird die schwache Fle- 
xion etwas wahrscheinlicher. 

Damit soll nicht gesagt werden, dass Ellipsen in den untersuchten Daten nur 
bei den Präpositionen von und zwischen auftreten: Bei der Entscheidung, ob eine 
Ellipse vorliegt oder nicht, müssen vor allem die Semantik der Adjektive (Anto- 
nymie?), die des Kopfnomens und eventuell auch die des regierenden Verbs (vgl. 
unterscheiden) berücksichtigt werden. Bei an fließendem und stehendem Gewässer 
(Rhein-Zeitung, 1.4.2006, o. S.) z.B. ist nach fließendem das Nomen Gewässer ein- 
gespart. Bei der Interpretation als Ellipse spielt die Präposition an keine Rolle: 
Die Vereinsmeisterschaft, über die im zitierten Zeitungsartikel berichtet wird, 
beinhaltet zwei Disziplinen, das Angeln in fließendem Gewässer und das Angeln 
in stehendem Gewässer. Die Antonymie der Adjektive und der weitere Kontext 
legen eine Ellipse nahe. 


8 Frequenz des ersten Adjektivs, Silbenzahl des zweiten Adjektivs, und-Test, /m/ in der 
Mitte des Substantivs, /m/ am Ende des Substantivs. 


4 Ergebnisse der Korpusuntersuchung — 115 


Zwar ist bei Adjektiven nach der Konjunktion und die schwache Flexion ins- 
gesamt sehr selten (vgl. Tab. 1 in Abschnitt 4.1.2). Dennoch lässt sich ein klei- 
ner Unterschied zwischen Nominalphrasen mit Ellipse und Nominalphrasen 
ohne Ellipse erkennen. Die Ergebnisse zu einer Stichprobe aus dem Datensatz 
ATTRIBUTIVE_ADJEKTIVE_2 sind in Tab. 5 aufgeführt. 


Tabelle 5: Ellipse und Flexion bei Koordination mit und. 


Flexion des zweiten Adjektivs 


(Muster X und Y + Nomen) Ellipse keine Ellipse 

schwach (-n) 67 = 5% 53= 9% 

stark (-m) 1.213 = 95% 559 = 91% 
1.280 = 100 % 612= 100 % 


In Konkurrenz zu den elliptischen Konstruktionen in unserem Datensatz 
ATTRIBUTIVE_ADJEKTIVE_2, die alle nur jeweils eine einzige Präposition enthal- 
ten (an fließendem und stehendem Gewässer angeln), stehen die oft leserfreundli- 
cheren, aber weniger ökonomischen und auch nicht immer zulässigen Konstruk- 
tionen mit zwei Präpositionen (an fließendem und an stehendem Gewässer angeln, 
aber "Balance zwischen privatem und zwischen beruflichem Leben). Die Bedin- 
gungen für das Auftreten oder den Wegfall der zweiten Präposition beschreibt 
Lotzow (2015). Die Frage, ob eine Ellipse der Präposition vorliegt (an fließendem 
und [an] stehendem Gewässer angeln) oder nicht (Balance zwischen privatem und 
beruflichem Leben; vgl. Lotzow 2015: 91), möchten wir trennen von der Frage, 
ob eine Ellipse des von der Präposition regierten Nomens (Gewässer, Leben) 
vorliegt. Wir vermuten, dass eine zweite Präposition die schwache Flexion des 
zweiten Adjektivs noch wesentlich unwahrscheinlicher macht als die von uns 
untersuchte Ellipse des Bezugsnomens: an fließendem und an ?stehenden Gewäs- 
ser angeln). Eine Untersuchung steht noch aus. 

Dass es für die Flexion einen Unterschied macht, ob die beiden Adjektive 
jeweils intersektiv sind oder nicht, konnte nicht nachgewiesen werden. Für die 
Wortstellung spielt dieser Faktor jedoch durchaus eine Rolle, s. Münzberg & 
Bildhauer (in dieser Ausgabe). 


4.1.5 Partizip vs. Nichtpartizip und Genus des Substantivs 
Ebenso wenig signifikant werden in den Regressionsanalysen Unterschiede zwi- 


schen (lexikalisierten oder nicht lexikalisierten) Partizipien und Nichtpartizipien 
bei den beiden Adjektiven und der Faktor Genus des Substantivs. 
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4.2 Phonologische Eigenschaften der Adjektive und des Substantivs 


Nach Niebuhr (2017) erzeugen /m/ in der Mitte und vor allem /m/ am Ende des 
Substantivs’ einen Trend zur starken Flexion des zweiten Adjektivs: in elegantem 
blauem Kostüm (Rhein-Zeitung, 30.10.2008, o. S.). Die Vorhersage trifft auf beide 
Datensätze zu, der Unterschied ist aber nur im großen Datensatz ATTRIBUTIVE_ 
ADJEKTIVE_2 signifikant. 

Die Regressionsanalyse zeigt, dass die Einflussgröße „Silbenzahl des zwei- 
ten Adjektivs“*° im größeren Datensatz signifikant ist, im kleineren Datensatz 
ATTRIBUTIVE_ADJEKTIVE_1 ist sie hingegen bei der Verrechnung mit anderen 
Prädiktoren (inkl. der semantischen Klasse des zweiten Adjektivs und des und- 
Test-Ergebnisses) nicht signifikant. Das Sprachmaterial, das zwischen der letz- 
ten starken Endung und der fraglichen Flexionsendung steht, scheint jedenfalls 
mehr Einfluss in Richtung der starken Flexion zu haben als die Silbenzahl des 
ersten Adjektivs. Eine ähnliche Tendenz gibt es bei der Erweiterung der Adjek- 
tive durch Adverbien und Partikeln im Datensatz ATTRIBUTIVE_ADJEKTIVE_1: 
Die Erweiterung des ersten Adjektivs hat keinen Einfluss auf die Flexion des 
zweiten Adjektivs, während die Erweiterung des zweiten Adjektivs - also wiede- 
rum Material zwischen der letzten starken Endung und der fraglichen Endung - 
in Richtung der starken Flexion wirken kann: 


(16) a. von individuellem, oft skurrilem Zubehör (Süddeutsche Zeitung, 
15.11.2004, S. 2) 
b. Nach monatelangem sehr hartem Training (Rhein-Zeitung, 15.1.1996, 
o. S.) 


Im Zusammenspiel mit den anderen Prädiktoren ist dieser Trend aber nicht mehr 
signifikant. 


9 Ermittelt mithilfe eines einfachen Algorithmus, der <mm> als ein /m/ rechnet, ent- 
sprechend <mm> am Ende des Substantivs als /m/ am Ende. In der Mitte des Substan- 
tivs können mehrere /m/ an verschiedenen Stellen stehen. 

10 Ermittelt mithilfe eines Algorithmus, der grundsätzlich pro Vokalbuchstaben eine 
Silbe ausgibt, wobei aber bestimmte Vokalbuchstabenkombinationen als Zeichen für 
nur eine Silbe gerechnet werden. 
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4.3 Frequenzeffekte 


Für die Frequenz’! des ersten Adjektivs lautete die Hypothese: Je häufiger das 
erste Adjektiv ist, desto häufiger erscheint schwache Flexion am zweiten Adjek- 
tiv. Dahinter stand der Gedanke, dass die Häufigkeit des ersten Adjektivs mit 
weiteren Eigenschaften determiniererähnlicher Adjektive korrelieren könnte. 
Tatsächlich zeigt sich in beiden Datensätzen ein (schwacher) Effekt in die erwar- 
tete Richtung.'” Die Frequenzeffekte überlagern aber nicht die semantisch- 
syntaktischen Faktoren. 

Im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 ist auch die substantivspezifische 
Adjektivfrequenz berücksichtigt (s. Münzberg & Bildhauer in dieser Ausgabe). 
Bei den Lemmata technisch und Gerät etwa kommt die Kombination aus attri- 
butivem Adjektiv (ohne ein vorangehendes anderes attributives Adjektiv) und 
Nomen 5.114-mal vor, während Gerät allein 289.091-mal gefunden wird. (Gesucht 
wurden Lemmata bzw. Stämme, nicht Wortformen.) Damit ergibt sich als sub- 
stantivspezifische Adjektivfrequenz ein Wert von 5.114 : 289.091 = 0,01769. Für 
technisch und Selbstbewusstsein liegt der Wert nur bei 0,00001. Je höher der Wert 
ist, desto eher tritt Wechselflexion ein. 


4.4 Geografische Verteilung: Land und Region 


Sprachgeografische Varianz ist für die Adjektivflexion von Bedeutung. Nicht nur 
im großen, auch im kleineren Datensatz sind für die Schweiz im Vergleich zu 
den anderen Ländern signifikante Abweichungen zu verzeichnen. Die Grafik in 
Abb. 4 wurde basierend auf dem größeren Datensatz ATTRIBUTIVE_ADJEKTIVE_2 
aus der Regressionsanalyse (siehe Anhang) erzeugt. Das bedeutet u.a.: Wenn in 
den Texten aus der Schweiz die beiden Adjektive häufiger koordiniert sind, ist 
das bereits berücksichtigt und kann das Ergebnis nicht verfälschen. 


11 Ermittelt anhand der DeReWo-Frequenzklassen, s. Belica et al. (2012). „Dabei hat eine 
Grundform die Häufigkeitsklasse N, wenn die häufigste Form etwa 2“-mal häufiger 
vorkommt als diese Form. Für die Grundformenliste ist der Eintrag mit der höchsten 
Frequenz ‚der,die,das‘“ (Belica et al. 2013: Kap. 2.5). Das bedeutet: Je höher die Fre- 
quenzklasse, desto seltener das Wort. 

12 Zum Zeitpunkt der Berechnung lagen nicht für alle Adjektive Frequenzklassen vor. 
Im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 wurden für die Untersuchung der Adjektiv- 
reihenfolge (Münzberg & Bildhauer in diesem Band) alle fehlenden Frequenzklassen 
nachgetragen. Eine Neuberechnung würde möglicherweise einen stärkeren Effekt zei- 
gen. Da allerdings auch der Frequenzeffekt im Datensatz ATTRIBUTIVE_ADJEKTIVE_2 
schwach war, haben wir auf eine Neuberechnung verzichtet. 
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Abbildung 4: Modellschätzwerte aus der logistischen Regressionsanalyse für schwache 
Flexion des zweiten Adjektivs im Datensatz ATTRIBUTIVE_ADJEKTIVE_2 nach Ländern. Nach 
oben ist die Wahrscheinlichkeit für schwache Flexion abgetragen (hoher Wert: hohe 
Wahrscheinlichkeit). 


Betroffen sind direkt aufeinanderfolgende Adjektive ohne Komma oder Kon- 
junktion.** Hier ist in der Schweiz die starke Flexion überrepräsentiert, während 
sie in den anderen Ländern unterrepräsentiert ist. Dazu passend finden sich etwa 
im Datensatz ATTRIBUTIVE_ADJEKTIVE_1 fünf Belege aus Deutschland für mit 
anschließendem gemütlichen Beisammensein (nur schwache Flexion des zweiten 
Adjektivs), während die Schweizer Daten zwei Belege für mit anschliessendem 
gemütlichem Beisammensein (nur starke Flexion) enthalten. Bei mit Komma ver- 
bundenen Adjektiven hingegen ist in allen Ländern gleichermaßen, nicht nur in 
der Schweiz, die starke Flexion überrepräsentiert. 

Um zu überprüfen, ob dieser Unterschied nur Herkunftsländer betrifft oder 
auch Regionen, haben wir die Zahlen aus der angrenzenden Region Südwest- 
deutschland mit alemannischen Basisdialekten herangezogen. In den Assoziati- 
onsplot aus dem Datensatz ATTRIBUTIVE_ADJEKTIVE_2 (Abb. 5) sind allerdings 
nur die Einflussgrößen Komma und Region abgetragen; die Chi-Quadrat-basierte 
Berechnung berücksichtigt also keine anderen Einflussfaktoren. Wie beim Ver- 
gleich der Länder untereinander zeigen sich Unterschiede bei ohne Komma 


13 Rechnerisch und visuell überprüft mithilfe eines Assoziationsplots, der die Pearson- 
Residuen darstellt, zum Datensatz ATTRIBUTIVE_ADJEKTIVE_1 mit den Einflussfakto- 
ren Komma JA/nEIN und Land (p 0,001). 
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direkt aufeinanderfolgenden Adjektiven, während sich bei mit Komma verbun- 
denen Adjektiven keine Unterschiede zwischen den Regionen ausmachen lassen. 
Die beiden auffälligen Regionen sind Südwest (SW) und Mittelost (MO). Hier ist 
in Folgen ohne Komma die starke Flexion überrepräsentiert. 

Die Vermutung, dass bei der Schweizer und südwestdeutschen Präferenz 
für Parallelflexion auch Lautsystem und Morphologie der Basisdialekte durch- 
scheinen (Gallmann 2016: 2), liegt nahe. Abweichungen in der Region Mittelost 
(Ihüringen, Sachsen) sind darüber aber kaum zu erklären. Peter (2013: 202) stellt 
die Hypothese auf, das „vergleichsweise häufige Auftreten der Parallelflexion 
in Adjektivreihungen in der Schweiz“ werde „vermutlich also zusätzlich durch 
die stärkere (präskriptive) Normorientierung der Schweizer Schreiberinnen und 
Schreiber begünstigt“. Unsere Ergebnisse bedeuten nicht, dass länderspezifisches 
Normbewusstsein (vgl. für die Schweiz Heuer et al. 2017: 139, die nur Parallel- 
flexion akzeptieren) beim Schreiben und im Lektorat keine Rolle für die Adjek- 
tivflexion spielen würde - beides, der Basisdialekt und das Normbewusstsein, 
kann zusammenwirken. 
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Abbildung 5: Assoziationsplot, der die Pearson-Residuen zur Verteilung starker und 
schwacher Flexion nach Regionen darstellt; n = 48.727 (ohne Region „überregional“, 
ohne Region „nicht zuzuordnen“ und ohne Belege aus der Schweiz, aus Österreich 

und aus Luxemburg. SW = Südwest, MO = Mittelost, MS = Mittelsüd, MW = Mittelwest, 
NO = Nordost, NW = Nordwest, SO = Südost). Der Unterschied zwischen diesen beiden 
Regionen einerseits und den übrigen Regionen andererseits zeigt sich im Fall Komma = 
0 (kein Komma zwischen den beiden Adjektiven) und den Regionen MO und SW. Blaue 
Balken stehen für ‚überrepräsentiert‘, rote für ‚unterrepräsentiert‘. (Grundlage: Daten- 
Satz ATTRIBUTIVE_ADJEKTIVE_2.) 
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4.5 Sprachwandel (Einflussgröße Jahr) und Verwendungskontext 
(Einflussgrößen Medium und Domäne) 


Schließlich zeigt die Entwicklung über die letzten hundert Jahre hinweg für 
den Dativ Singular Maskulinum/Neutrum (und nur für diese Merkmalskombi- 
nation) im Datensatz ATTRIBUTIVE_ADJEKTIVE_2 wieder einen Anstieg der im 
17./18. Jahrhundert so geläufigen (vgl. Peter 2013: 188) Wechselflexion. Das wird 
aus Abb. 6 ersichtlich. 
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Abbildung 6: Modellschätzwerte aus der logistischen Regressionsanalyse zur Entwick- 
lung hin zur Wechselflexion. Uber die Jahre hinweg wird die schwache Flexion des 
zweiten Adjektivs immer wahrscheinlicher. (Grundlage: Datensatz ATTRIBUTIVE_ADJEKTIVE_2.) 


Dieser Anstieg ist besonders steil in der Schweiz, es findet also eine Angleichung 
statt. 

Im kleinen Datensatz ATTRIBUTIVE_ADJEKTIVE_1 und in einer Stichprobe aus 
dem Datensatz ATTRIBUTIVE_ADJEKTIVE_2, die genauso klein ist wie der Daten- 
satz ATTRIBUTIVE_ADJEKTIVE_1, deutet sich bei der Regressionsanalyse dieselbe 
Richtung des Einflusses an - also immer mehr schwache Flexion -, wobei der 
Prädiktor Jahr in der Stichprobe nicht signifikant ist. 

Vielleicht der Normdiskussion und dem professionellen Lektorat zuzurech- 
nen ist die im Datensatz ATTRIBUTIVE_ADJEKTIVE_2 auffällige Tendenz zur Par- 
allelflexion beim Medium Buch und in der Domäne Fiktion; damit ist die starke 
Endung -m auch im Register literarische Texte überrepräsentiert. 
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Auf die Flexion des zweiten Adjektivs wirken sprachsystematische (Syntax, 
Semantik, Phonologie, Frequenz) und extralinguistische Einflussgrößen (geogra- 
fische Verteilung, Alter des Belegs, Verwendungskontext). Regressionsanalysen 
erlauben es, mehrere Einflussgrößen zugleich zu berücksichtigen. 

Abbildung 7 fasst die Ergebnisse aus dem Datensatz ATTRIBUTIVE_ADJEK- 
TIVE_1 zusammen. Das Schaubild zeigt geschätzte Koeffizienten aus einem 
logistischen Regressionsmodell, in dem die Werte der Prädiktoren zur besseren 
Vergleichbarkeit binär kodiert sind. Die genauen Koeffizienten und Ergebnisse 
des Regressionsmodells sind im Anhang dargestellt. Der Plot ist wie folgt zu 
lesen: Je weiter ein Punkt von der senkrechten Mittellinie (0) entfernt ist, desto 
stärker ist der Effekt. Nach links sind negative Koeffizienten abgetragen, die die 
schwache Flexion des zweiten Adjektivs weniger wahrscheinlich machen, nach 
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Abbildung 7: Geschätzte Koeffizienten aus einem logistischen Regressionsmodell zum 
Datensatz ATTRIBUTIVE_ADJEKTIVE_1. Legende: ADJ2: zweites Adjektiv. ADJ1: erstes Adjektiv. 
ADJ2: Ordinalzahl: Das zweite Adjektiv ist eine Ordinalzahl. ADJ2_N: frequent: Das 
zweite Adjektiv kommt außerhalb des vorliegenden Datensatzes besonders häufig als 
attributives Adjektiv zum betreffenden Substantiv vor (Häufigkeit der Adjektiv-Subs- 
tantiv-Kombination geteilt durch Häufigkeit des Substantivs > 0,02). ADJ1: frequent: 
DeReWo-Frequenzklasse des ersten Adjektivs < 8, d. h., das erste Adjektiv ist be- 
sonders häufig. ADJ2 > 4 Silb.: Das zweite Adjektiv hat über 4 Silben (Flexionssuffix 
mitgerechnet); hier nicht signifikant, wohl aber im großen Datensatz (siehe Anhang). 
Subst_m_Mitte, Subst_m_Ende: /m/ in der Mitte des Substantivs (nicht signifikant, 
aber im großen Datensatz [siehe Anhang]) bzw. /m/ am Ende des Substantivs (nicht 
signifikant, aber im großen Datensatz [siehe Anhang]). und-Test: Zwischen die beiden 
Adjektive lässt sich und oder etwas wie d. h., und zwar einfügen. 
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rechts positive Koeffizienten, die die Wahrscheinlichkeit für schwache Flexion 
erhöhen. Die waagerechten Linien stehen für 95 %-Konfidenzintervalle. 

Die stärksten Effekte haben also das Komma als Symptom einer möglichen 
Koordination, die Ausprägung „Schweiz“ des Faktors Land und die Ausprägung 
„Ordinalzahl“ des Faktors semantische Klasse des zweiten Adjektivs: In NPs mit 
Komma (mit kurzem, rotbraunem Haar, Süddeutsche Zeitung, 12.3.2002, S. 14) 
sowie in Schweizer Belegen (mit dichtem schwarzem Haar, St. Galler Tagblatt, 
26.6.1999, 0. S.) überwiegt Parallelflexion, ansonsten ist Wechselflexion häufiger 
(mit dichtem schwarzen Haar, Süddeutsche Zeitung, 23.4.2001, S. 15). Besonders 
Ordinalzahladjektive werden eher schwach flektiert (nach verlorenem ersten Satz 
steigerte er sich jedoch und gewann verdient, St. Galler Tagblatt, 22.5.2000, o. S.).'* 


14 Fast alle Belege zu Ordinalzahladjektiven an zweiter Stelle entstammen solchen 
Sportnachrichten. 
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6 Anhang 
6.1 Modellspezifikation 


Für die vermuteten Einflussfaktoren wurden logistische Regressionsanaly- 
sen durchgeführt. Die statistischen Analysen beziehen sich entweder auf den 
Datensatz ATTRIBUTIVE_ADJEKTIVE_ı oder auf den Datensatz ATTRIBUTIVE_ 
ADJEKTIVE_2. Der Bezug zum Datensatz wird an den jeweiligen Stellen im Text 
gekennzeichnet. Die Daten der beiden Datensätze wurden jeweils in mehreren 
logistischen Regressionsanalysen mit festen Effekten modelliert (generalisierte 
lineare Modelle; vgl. Jaeger 2008). Dabei wurde in Abhängigkeit der verschie- 
denen Prädiktoren die Wahrscheinlichkeit modelliert, dass in einem gegebenen 
Fall starke oder schwache Flexion auftritt. Der Einfluss einzelner Prädiktoren 
(unabhängig von anderen Prädiktoren) auf diese Wahrscheinlichkeit kann dabei 
jedoch nicht quantifiziert werden. Stattdessen wird der Einfluss einzelner Prä- 
diktoren auf die logarithmierte Chance, das Logit, geschätzt. 

Die Einflussfaktoren für beide Datensätze werden in Abschnitt 3 beschrieben. 
Ausgeschlossene Faktoren trugen entweder nicht zur Verbesserung des Modells 
bei oder wiesen eine zu starke Korrelation mit einem anderen Faktor auf. Damit 
ergeben sich folgende Modellspezifikationen: 


Datensatz ATTRIBUTIVE_ADJEKTIVE_2 


P(Flexion = schwach) = logit’ (By + Conj, also x Pı + Conjo x Pz + Conjl1 x fps + 
Conjbeziehungsweise x B, + Conjbzw. x Ps + Conjund x Pe + CO_DOMAINI x p; + 
CO_DOMAIN2 x ßs + CO_DOMAIN3 x ßo+ CO_DOMAINA x Pio + CO_DOMAIN5 
x Pıı + CO_COUNTRYCH x 2 + CO_COUNTRYD x 3 + CO_COUNTRYLU x fig 
+ scale(CO_YEAR) x B15 + Silb2 x Bis + ADF1.Lemma.FC x Pır + NN_m_Mitte x Bis 
+NN m Endel x Pis) 


Datensatz ATTRIBUTIVE_ADJEKTIVE_1 


P(Flexion = schwach) = logit! (Po + LandCH x p, + LandD x fp, + LandLU x p; + 
Sem2ref-temp x Pa + Sem2rel-ber x fp; + Sem2rel-geo x Pe + Sem2quali-farb x B, + 
Sem2quali-rel x Ps + Sem2ref-lok x By + Sem2ordi x Bio + und1 x By. + und2 x Biz + 
Komma1 x pı; + Frequ1 x B14 + NN_m_Mitte x Bis + NN_m_Ende1 x Pis + Silb2 x 
Bry + f_ADJ2_N x Pis) 
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Auflösung der Abkürzungen in der Reihenfolge ihres Vorkommens: 


Flexion: Flexionsendung des zweiten Adjektivs (stark oder schwach) 

Conj: Konjunktion (aber, also mit vorangehendem Komma, beziehungsweise, 
bzw., und), Komma (Wert 1) oder weder Konjunktion noch Komma (Wert o) 
zwischen den beiden Adjektiven 

CO_DOMAIN: Domäne Fiktion (1), Kultur/Unterhaltung (2), Mensch/Natur 
(3), Politik/Wirtschaft/Gesellschaft (4), Technik/Wissenschaft (5) oder un- 
klassifizierbar (o) 

CO_COUNTRY: Österreich (A), Schweiz (CH), Deutschland (D), Luxemburg 
(LU) 

CO_YEAR: Erscheinungsjahr 

Silb2: Anzahl der Silben des zweiten Adjektivs 

ADJ1.Lemma.FC: Frequenzklasse des ersten Adjektivs 

NN_m Mitte: Anzahl der m-Phoneme zwischen erstem und letztem Phonem 
des Nomens 

NN_m_Ende: Endung des Nomens auf Phonem /m/ oder nicht 

Land: Osterreich (A), Schweiz (CH), Deutschland (D), Luxemburg (LU) 
Sem2: semantische Klasse des zweiten Adjektivs nach einem 11-Klassen- 
System. Werte: art-dem (Adjektiv, das einem Demonstrativum nahekommt: 
einige; kommt im Datensatz nicht vor); art-indef (Adjektiv, das einem Inde- 
finitum nahekommt: besagt); ordi (Ordinalzahladjektiv: zweite); quali-farb 
(Farbadjektiv: rot); quali-rel (ursprünglich qualitatives Adjektiv in relationa- 
ler Lesart, vgl. stark in starke Raucherin); quali-sonst (sonstiges qualifizie- 
rendes Adjektiv: groß); ref-lok (referenzielles Adjektiv mit lokalem Bezug: 
dortig); ref-temp (referenzielles Adjektiv mit temporalem Bezug: damalig); 
rel-ber (Zugehörigkeitsadjektiv, das weder eine geografische Herkunft noch 
eine materielle Beschaffenheit bezeichnet: finanziell); rel-geo (Zugehörig- 
keitsadjektiv, das eine geografische Herkunft oder Zugehörigkeit bezeichnet: 
sächsisch); rel-material (Adjektiv, das eine materielle Beschaffenheit bezeich- 
net: hölzern) 

Komma: Komma (Wert ı) oder kein Komma (Wert o) zwischen den beiden 
Adjektiven 

Frequi: Frequenzklasse des ersten Adjektivs 

f_ADJ2_N: substantivspezifische Adjektivfrequenz (Häufigkeit der Adjektiv- 
Substantiv-Kombination geteilt durch Häufigkeit des Substantivs im gesam- 
ten Untersuchungskorpus) 
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6.2 Ergebnisse 
6.2.1 Datensatz: ATTRIBUTIVE_ADJEKTIVE_2 


Tabelle 6: Regressionsanalyse zu ATTRIBUTIVE_ADJEKTIVE_2 (Nagelkerkes R?= 0,41) 


Faktor/Ausprägung geschätzter | Std.-Fehler Zz p 
Koeffizient 
(Intercept) -0,995 0,111 -8,928 <2e-16 *** 
Conj, also -1,861 1,000 -1,860 0,063 
Conjo 2,763 0,099 27,974 <2e-16 *** 
Conj1 0,787 0,100 7,868 3,60e-15 *** 
Conjbeziehungsweise -0,446 0,382 -1,168 0,243 
Conjbzw. -0,810 0,340 -2,383 0,017 * 
Conjund -0,719 0,102 -7,053 1,75e-12 *** 
CO_DOMAIN1 -0,926 0,131 -7,054 1,73e-12  *** 
CO_DOMAIN2 0,235 0,037 6,390 1,66e-10 *** 
CO_DOMAIN3 0,129 0,060 2,167 0,030 * 
CO_DOMAIN4 0,159 0,037 4,317 1,58e-05 *** 
CO_DOMAIN5 0,124 0,044 2,803 0,005 ** 
CO_COUNTRYCH -1,235 0,037 -33,665 <2e-16 *** 
CO_COUNTRYD -0,007 0,024 -0,300 0,765 
CO_COUNTRYLU -0,538 0,121 -4,430 9,42e-06 *** 
scale(CO_YEAR) 0,078 0,008 10,312 <2e-16 *** 
Silb2 -0,183 0,006 -29,220 <2e-16 *** 
ADJ1.Lemma.FC -0,050 0,002 -23,505 <2e-16 *** 
NN_m_Mitte -0,119 0,023 -5,140 2,75e-07 *** 
NN_m_Ende1 -0,352 0,044 -7,942 1,99e-15  *** 
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6.2.2 Datensatz: ATTRIBUTIVE_ADJEKTIVE_1 


Tabelle 7: Regressionsanalyse zu Datensatz ATTRIBUTIVE_ADJEKTIVE_1 (Nagelkerkes R? = 0,29) 


Faktor/Ausprägung geschatzter | Std.-Fehler z p 
Koeffizient 
(Intercept) 1,476e+00 3,817e-01 3,867 0,000110 *** 
LandCH -1,309e+00 2,926e-01 -4,472 7,74e-06 *** 
LandD 1,330e-01 1,902e-01 0,700 0,484 
LandLU -1,268e+00 1,048e+00 -1,209 0,227 
Sem2ref-temp 1,880e-01 6,533e-01 0,288 0,773 
Sem2rel-ber 2,204e-01 1,869e-01 1,179 0,238 
Sem2rel-geo 2,258e-01 2,644e-01 0,854 0,393 
Sem2quali-farb 5,447e-01 2,777e-01 1,961 0,050 * 
Sem2quali-rel 1,088e+00 6,420e-01 1,695 0,090 
Sem2ref-lok 7,097e-01 5,133e-01 1,383 0,167 
Sem2ordi 8,374e-01 5,296e-01 1,581 0,114 
und1 -5,567e-01 2,312e-01 -2,408 0,016 * 
und2 -2,699e-01 4,477e-01 -0,603 0,547 
Komma1 -1,515e+00 2,267e-01 -6,681 2,38e-11  *** 
Frequ1 -7,128e-02 2,006e-02 -3,553 0,0004 *** 
NN_m_Mitte -3,843e-01 1,897e-01 -2,025 0,043 * 
NN_m_Ende1 -6,296e-01 4,385e-01 -1,436 0,151 
Silb2 -9,513e-02 5,974e-02 -1,592 0,111 
f_ADJ2_N 3,426e-05 1,364e-05 2,512 0,012 * 
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Außerdem wurde überprüft, ob es Korrelationen zwischen den Faktoren gab, 
die in die Regressionsanalysen eingingen. Lediglich zwischen den Faktoren 
„Komma“ und „und“ konnte eine starke Korrelation nachgewiesen werden 
(Cramers V = 0,76). 

Um in Abschnitt 5 die Effekte durch die Einflussfaktoren vergleichbarer zu 
machen und die Erkenntnisse zusammenzufassen, wurden die Werte der einzel- 
nen Einflussfaktoren in binäre Kategorien zusammengefasst. In einem weiteren 
logistischen Regressionsmodell wurden die Daten mit den binär kodierten Ein- 
flussfaktoren als feste Effekte modelliert. In der zusammenfassenden Darstellung 
in Abb. 7 sind die geschätzten Koeffizienten aus diesem Regressionsmodell dar- 
gestellt. Die Ergebnisse sind in Tab. 8 festgehalten. 


Tabelle 8: Regressionsanalyse zu Datensatz ATTRIBUTIVE_ADJEKTIVE_1 mit binär kodierten 
Werten der Einflussfaktoren (Nagelkerkes R?= 0,27). 


Faktor/Ausprägung geschätzter | Std.- z p 
Koeffizient Fehler 
(Intercept) 0,219 0,209 1,043 0,300 
LANDLand_CH -1,413 0,239 -5,920 3,23e-09 *%** 
Kommat1 -1,599 0,218 -7,329 2,32e-13 *** 
UNDUND_JA -0,528 0,199 -2,650 0,008 ** 
SEM2Sem2_ORDI 1,560 0,415 3,759 0,0002 *** 
FREQU1FREQU1_8 0,391 0,125 3,119 0,002 ** 
NN_M_MITTE_NN_m_Mitte_JA -0,367 0,196 -1,872 0,061 
NN_M_ENDE1 -0,676 0,438 -1,545 0,122 
SILB2Silb2_groesser_4 -0,273 0,145 -1,884 0,060 
FADJ2Nf_Adj2_N_hoch 0,527 0,201 2,627 0,009 =** 


Auflösung der Abkürzungen, die in den anderen beiden Modellen nicht 

vorkommen: 

- UNDUND_JA: und-Test: Zwischen die beiden Adjektive lässt sich und oder 
etwas wie d.h., und zwar einfügen 

- LANDLandCH: Beleg stammt aus der Schweiz 

- FREQU1FREQU1_8: DeReWo-Frequenzklasse des ersten Adjektivs kleiner 
gleich 8, d.h., das erste Adjektiv ist besonders häufig. 

- SILB2Silb2_groesser_4: Das zweite Adjektiv hat über 4 Silben (Flexionssuffix 
mitgerechnet) 

- FADJ2Nf_Adj2_N_hoch: Das zweite Adjektiv kommt außerhalb des vorlie- 
genden Datensatzes besonders häufig als attributives Adjektiv zum betreffen- 
den Substantiv vor (Häufigkeit der Adjektiv-Substantiv-Kombination geteilt 
durch Häufigkeit des Substantivs > 0,02) 
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Franziska Münzberg © & Felix Bildhauer © 
Reihenfolge attributiver Adjektive 


Abstract The present chapter investigates the relative order of attributive 
adjectives in German. Based on corpus data, our results corroborate previous find- 
ings that semantics is the most important factor in accounting for adjective order. 
Going beyond previous studies, we also consider coordinated structures (such as 
mit [[großem, verwildertem] Garten] ‘with (a) large, overgrown garden’), where 
both adjectives are of equal rank. While adjective order in embedded structures 
(mit [schwierigem [familiärem Hintergrund]] ‘with (a) difficult domestic 
background’) can be predicted rather accurately on semantic grounds, we show 
that predictions can also be made for coordinated structures, albeit with lower 
accuracy. Using regression analysis, we examine how semantic factors interact 
with a number of other explanatory variables. 


Keywords word order, noun phrase, adjective, attribute, attributive participle, 
logistic regression, random effects model 


Open Data Der Datensatz ATTRIBUTIVE_ADJEKTIVE_1 ist Öffentlich zugänglich 
und durchsuchbar in der Datenbank attributive Adjektive (DOI: 10.14618/ 
attributiveAdjektiveDB). 


1 Fragestellung 


Für die Reihenfolge attributiver Adjektive links vom Kopfnomen sind vor allem 

semantische bzw. kognitive Kriterien und damit die folgende Grundreihenfolge 

beschrieben worden: 

- Artikelklassifikatoren - Qualificativa - Nominalklassifikatoren (vgl. Eichin- 
ger 1991: 327) 

- bzw. referenziell - qualitativ - klassifikatorisch (vgl. Schlotthauer 2017: 1646) 


Nominalgruppen, in denen die Adjektivreihenfolge dieser Grundreihenfolge ent- 
spricht, wären etwa: 


Münzberg, Franziska & Felix Bildhauer. 2020. Reihenfolge attributiver Adjektive. In Marek Konopka, 131 
Angelika Wöllstein & Ekkehard Felder (Hgg.), Bausteine einer Korpusgrammatik des Deutschen, Bd. 1, 

131-156. Heidelberg: Heidelberg University Publishing. DOI: https://doi.org/10.17885/heiup. 
bkgd.2020.0.24238 
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(1) a. der besagte (referenziell) gerechte (qualitativ) finanzielle (klassifika- 
torisch) Ausgleich 
b. andere (referenziell) beeindruckende (qualitativ) landschaftliche 
(klassifikatorisch) Schönheiten 


Unter den Adjektiven mit qualitativer Lesart stehen die wertenden Adjektive vor 
den übrigen (vgl. Adam & Schecker 2011: 164). 

Aus formaler Perspektive werden die Möglichkeit der prädikativen Verwen- 
dung, die Komparierbarkeit und die Wortbildung der Adjektive als Kriterien für 
ihre Abfolge angeführt (vgl. Eisenberg 2013: 393-394): Prädikativ Verwendbares, 
Komparierbares und Deverbales steht mittig (und hat in der Regel eine qualita- 
tive Lesart). Substantivderivate haben meist eine klassifikatorische Lesart und 
stehen entsprechend rechts, also näher am Kopfnomen. 


(2) andere (nicht’ prädikativ verwendbar, nicht komparierbar) beeindru- 
ckende (prädikativ verwendbar, komparierbar, deverbal) landschaft- 
liche (nur eingeschränkt? prädikativ verwendbar, nicht komparierbar, 
desubstantivisch) Schönheiten 


In einer Synthese von solchen semantischen und morphosyntaktischen Eigen- 
schaften attributiver Adjektive gibt die Dudengrammatik (2016: 346) ähnlich wie 
Engel (vgl. 1988: 634-635) eine feiner gegliederte Abfolge an. Zu der nur leicht 
modifizierten Form, in der wir diese Eigenschaften als „ı1-Klassen-System“ in 
Abschnitt 3.1 übernommen haben, vgl. Münzberg & Hansen in dieser Ausgabe. 
Diese gut gesicherten Erkenntnisse werden hier um Spezifikationen ergänzt, 
die sich nicht aus den beschriebenen semantischen und syntaktischen Eigen- 
schaften ableiten lassen. So soll etwa überprüft werden, ob das Behaghel’sche 
„Gesetz der wachsenden Glieder“ (Behaghel 1909: 139; vgl. auch Behaghel 1932: 
6 = § 1416) für aufeinanderfolgende attributive Adjektive gilt, ob also kürzere 


Soweit man davon ausgeht, dass anders ein eigenes Lexem ist. 

2 Anstelle einer auffälligen Formulierung mit prädikativem Gebrauch wie Die Schön- 
heiten sind landschaftlich könnte man ausweichen auf Alternativen mit attributivem 
Gebrauch wie Die Schönheiten sind landschaftlicher Natur / von landschaftlicher Art 
o.Ä. Den prädikativen Gebrauch solcher Adjektive kategorisch auszuschließen, wäre 
falsch, vgl. fürs Englische Demonte (2019: 406-407). Das liegt nicht zuletzt an der 
Polysemie von Adjektiven. Das Adjektiv landschaftlich kann zum Beispiel auch ‚regi- 
onal, areal, diatopisch markiert’ bedeuten und ist dann uneingeschränkt prädikativ 
verwendbar: Das Substantiv Sonnabend ist mittlerweile eindeutig landschaftlich. Man 
könnte allerdings argumentieren, dass ursprünglich klassifikatorische Adjektive bei 
prädikativem Gebrauch ihre semantische Klasse wechseln und zu qualitativen Adjek- 
tiven werden. 
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Adjektive vor längeren stehen und ob durch ein Adverb modifizierte Adjektive 
nach nicht modifizierten Adjektiven stehen. Was die Einteilung in semantische 
Klassen angeht, wird zusätzlich zum 11-Klassen-System ein Faktor mit nur zwei 
Ausprägungen (,„2-Klassen-System“) etabliert: Die beiden Ausprägungen sind 
„intersektiv“ und „nicht intersektiv“ (s. Abschnitt 3.2). Untersucht wird auch, 
ob Partizipien im vorliegenden Datensatz eher vor Nichtpartizipien stehen (vgl. 
Sommerfeldt 1971: 15). Darüber hinaus soll die Wahrscheinlichkeit dafür, dass 
ein Adjektiv attributiv zu einem gegebenen Substantiv auftritt, einbezogen wer- 
den (= P(Adj|N), im Weiteren „substantivspezifische Adjektivfrequenz“; vgl. fürs 
Englische Wulff (2003: 267), dort als „noun-specific frequency“). Die Erwartung 
ist, dass ein Adjektiv dann eher nahe beim Substantiv steht, wenn es auch sonst 
häufig attributiv zu diesem Substantiv steht. Auch Effekte der Frequenzklassen 
der beiden Adjektive sollen geschätzt werden: Das linke Adjektiv könnte deter- 
miniererähnlicher und damit tendenziell häufiger sein als das rechte (andere 
landschaftliche Schönheiten). 

Darüber hinaus gibt es noch mehr mögliche Einflussgrößen, die vor allem in 
Bezug auf das Englische untersucht worden sind. Viele sind nur schwer objekti- 
vierbar. Einen Überblick gibt Dyer (2017: 5-67). 


2 Korpus, Suchanfrage und Methoden 


Ausgewertet wurde der Datensatz ATTRIBUTIVE_ADJEKTIVE_1 aus der Untersu- 
chung der Adjektivflexion im Dat. Sg. Mask./Neutr. (vgl. Münzberg & Hansen 
in dieser Ausgabe). Er wurde aus einem Ausschnitt von ı22 Millionen Tokens 
aus dem Untersuchungskorpus erzeugt und enthält nach dem Aussortieren von 
Fehlbelegen 1.598 Belegsätze zur Suchanfrage 


erstes Adjektiv 20 zweites Adjektiv mit 


Adverb | Mit Endung -em | adverb | Endung -em oder -en Nomen 


Präposition 


Wortgruppen, die diesem Muster entsprechen würden, sind etwa: 


(3) a. mit langem schwarzem/schwarzen Haar 
b. mit langem, schwarzem/schwarzen Haar 
c. mit ziemlich langem schwarzem/schwarzen Haar 
d. mit ziemlich langem, beinah schwarzem/schwarzen Haar 


Die Besonderheit der Daten ist also, dass keine der einschlägigen Nominalphra- 
sen einen Determinierer enthält. Das kann für die Interpretation der Ergebnisse 
eine Rolle spielen, vgl. Abschnitt 3.1 sowie die Einleitung zu dieser Ausgabe. 
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Die Beschränkung auf Nominalphrasen mit exakt zwei attributiven Adjek- 
tiven erklärt sich dadurch, dass schon zwei attributive Adjektive in unserem 
hauptsächlich Pressetexte enthaltenden Untersuchungskorpus außergewöhnlich 
sind, mehr als zwei aber äußerst selten. Die Auswertung eines anderen Daten- 
satzes aus einem Achtel des gesamten Untersuchungskorpus illustriert das: 
Von 2.388 Nominalphrasen, deren Kopf ein Appellativ ist (kein Pronomen, kein 
Eigenname) und die eine der Funktionen Subjekt, Prädikativ, Akkusativobjekt, 
Dativobjekt haben, enthalten 26,00 % ein attributives Adjektiv, 1,59% zwei attri- 
butive Adjektive und nur 0,08% drei attributive Adjektive. 

Bei der nachträglichen Belegannotation wurden die folgenden Einflussgrö- 
Ben für jedes der beiden Adjektive berücksichtigt (in Abschnitt 3.1-3.7 werden 
sie näher erläutert): 

- semantische Klasse (11-Klassen-System) 

- semantische Klasse (2-Klassen-System) 

- Partizip JA/NEIN 

- Silbenzahl (inklusive der Silbe des Flexionssuffixes) 
- Erweiterung durch ein Adverb 

- Frequenz 

- substantivspezifische Adjektivfrequenz 


Zusätzlich wurde die Möglichkeit bewertet, die beiden Adjektive zu tauschen, 
ohne dass sich die Semantik der Nominalgruppe wesentlich ändert oder die Rei- 
henfolge sehr ungewöhnlich wirkt.” Wenn dieser Tausch „gelang“, wurde der 
Wert ı vergeben, sonst der Wert o. Starke/schwache Flexion wurde bei diesem 
Tauschtest ignoriert: Die beiden Adjektive in der Präpositionalgruppe in edlem 
zeitgemäßen Ambiente sind also als tauschbar markiert worden. Das Ergebnis 
des Tauschs wäre dann nicht in zeitgemäßen edlem Ambiente, sondern in zeit- 
gemäßem edlem Ambiente oder in zeitgemäßem edlen Ambiente. Diese Annota- 
tion sollte nicht als Einflussgröße in statistische Modelle übernommen werden. 
Vielmehr dient sie bei der Untersuchung der nicht semantischen Einflussgrößen 
der Differenzierung von kategorischen Kontexten und Wahlkontexten. 

Auf der Grundlage dieser Daten haben wir ein logistisches Regressionsmodell 
spezifiziert. Dieses modelliert die Wahrscheinlichkeit dafür, dass ein bestimmtes 
der beiden Adjektive (der „Kandidat“) die rechte, dem Kopfnomen nähere Posi- 
tion einnimmt, in Abhängigkeit von einigen der oben benannten Einflussgrößen. 
Für diese Einflussgrößen werden dabei Koeffizienten geschätzt, welche die Größe 
des jeweiligen Effekts darstellen. Um die Daten mit einer logistischen Regression 


3 Die Annotation wurde von zwei Personen vorgenommen. Das Interrater-Agreement 
war „moderate“ im Sinne von Landis & Koch (1977); Cohens Kappa = 0,5. Das Unter- 
suchungsziel war den annotierenden Hilfskräften des IDS nicht bekannt. 
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zu analysieren, wurde in zufällig ausgewählten 799 Belegen (entspricht 50% der 

Fälle) das zweite Adjektiv als „Kandidat“ ausgezeichnet. Die abhängige Variable 

(„steht rechts“) ist in diesen Fällen „ı“. In der anderen Hälfte der Fälle wurde 

dagegen das linke Adjektiv als „Kandidat“ ausgezeichnet, die abhängige Variable 

(„steht rechts“) ist in diesen Fällen „o“. Das jeweils andere Adjektiv wird im Fol- 

genden als „Konkurrent“ bezeichnet. 
In einem gemischten logistischen Regressionsmodell haben wir folgende 

Faktoren berücksichtigt: 

- semantische Klasse (2-Klassen-System) Kandidat: INTERSEKTIV, NICHT- 
INTERSEKTIV 

- semantische Klasse (2-Klassen-System) Konkurrent: INTERSEKTIV, NICHT- 
INTERSEKTIV 

- Kandidat ist Partizip: JA, NEIN 

- Konkurrent ist Partizip: JA, NEIN 

- Differenz Silbenzahl, dichotomisiert als posıtıv (Kandidat hat mehr Silben 
als Konkurrent), NICHTPOSITIV 

- Differenz substantivspezifische Adjektivfrequenz (SAF), dichotomisiert als 
POSITIV (SAF des Kandidaten ist größer als die des Konkurrenten), NICHT- 
POSITIV 

- Differenz Frequenzklasse, dichotomisiert als posırıv (Kandidat hat höhere 
Frequenzklasse als Konkurrent), NICHTPOSITIV 

- Kandidat ist durch ein Adverb erweitert: JA, NEIN 

- Konkurrent ist durch ein Adverb erweitert: JA, NEIN 


Außerdem wurde das Lemma des Kandidatenadjektivs als Gruppierungsfaktor 
verwendet. 

Die Abfolge semantischer Klassen nach dem 11-Klassen-System wurde im 
Regressionsmodell nicht berücksichtigt, da durch die zahlreichen Ausprägungen 
dieser Variablen z. T. Gruppen mit sehr wenigen Fällen entstehen (und Koeffizien- 
tenschätzungen entsprechend ungenau werden). Stattdessen bietet Abschnitt 3.1 
einen deskriptiven Überblick über den Zusammenhang zwischen semantischer 
Klasse und Reihenfolge. Die elfte Klasse kam nicht vor; sie war vorgesehen für 
den Fall, dass beim Part-of-Speech-Tagging Determinierer als attributive Adjek- 
tive ausgezeichnet würden. Bei der Auszählung haben wir z.B. festgestellt, dass 
im vorliegenden Datensatz 33-mal ein relationales Adjektiv mit Bezug auf die 
zeitliche Situierung (derzeitig, früher) vor einem Zugehörigkeitsadjektiv (juris- 
tisch, politisch) steht und die umgekehrte Reihenfolge nicht vorkommt. Genauso 
wurden auch alle anderen vorkommenden Kombinationen ausgezählt. Theore- 
tisch hatte man für 10 semantische Klassen auch 10 verschiedene „Distanzklas- 
sen“ erhalten können, je nachdem, wie weit entfernt Adjektive einer bestimmten 
semantischen Klasse von ihrem Kopfnomen stehen. Dazu ist der Datensatz aber 
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zu klein — Adjektive, die eine materielle Beschaffenheit bezeichnen (steinern, 
wollen), kommen beispielsweise nur 5-mal vor, und für einige Kombinationen 
gibt es auch zu wenige Belege. Eine Beschränkung auf nur 6 verschiedene Dis- 
tanzklassen erschien von daher sinnvoll. 


3 Ergebnisse der Korpusuntersuchung 


Im Folgenden werden die Wirkungen der einzelnen Einflussgrößen beschrieben. 
Dem Überblick über die in der Dudengrammatik (2016: 346) angesetzten seman- 
tischen Klassen und unsere 6 Distanzklassen folgen ab Abschnitt 3.2 die Ergeb- 
nisse der Regressionsanalyse. Abb. ı in Abschnitt 4 fasst dann die wichtigsten 
Punkte zusammen. 


3.1 Semantische Klasse der Adjektive (11-Klassen-System) 


Da in der Suchanfrage nur artikellose Nominalphrasen berücksichtigt sind, neh- 
men Ordinalzahladjektive im vorliegenden Datensatz einen anderen Platz ein als 
gewöhnlich (weiter rechts als sonst erwartbar), wie z.B. in (4). 


(4) [...] nach verlorenem ersten Satz steigerte er sich jedoch und gewann ver- 
dient (St. Galler Tagblatt, 22.05.2000, o. S.) 


Fast alle Belege zu Ordinalzahladjektiven an zweiter Stelle entstammen solchen 
Sportnachrichten. Diesen 72 Belegen steht ein einziger Beleg mit einem Ordinal- 
zahladjektiv an erster Stelle gegenüber. 

Suchen mit dem Beispiel erst- in einem Achtel des 7-Mrd.-Untersuchungskor- 
pus ergaben die Zahlen in Tab. ı. 


Tabelle 1: Artikellose Nominalphrasen mit Ordinalzahladjektiv erst- im Untersuchungs- 
korpus. 


Suchanfrage Ergebnisse 

pro Mio. Tokens 
Präposition erstem attributives Adjektiv 0,03 
Präposition attributives Adjektiv erstem 0,04 
Präposition attributives Adjektiv ersten 0,55 


Das heißt, dass das Ordinalzahladjektiv erst- in artikellosen Nominalphrasen in 
nur 5% der Fälle an erster Stelle vor einem anderen attributiven Adjektiv steht 
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(0,03 / (0,03 + 0,04 + 0,55) = 0,05). Dagegen tritt in Nominalphrasen mit definitem 


oder indefinitem Artikel das Ordinalzahladjektiv in 73 % der Fälle vor das andere 


Adjektiv, wie Tab. 2 zeigt. 


Tabelle 2: Nominalphrasen mit Artikel und Ordinalzahladjektiv erst- im Untersuchungs- 


korpus. 
Suchanfrage Ergebnisse pro 
Mio. Tokens 
Präposition | Artikel | ersten attributives Adjektiv 8,62 
Präposition | Artikel | attributives Adjektiv | ersten 3,22 


Die Variation bei der Stellung von Ordinalzahladjektiven ist semantisch nicht 


frei: Ein erster verlorener Satz kann der zweite Satz nach einem gewonnenen ers- 


ten Satz sein, ein verlorener erster Satz ist immer der erste Satz. Offensichtlich ist 


in Nominalphrasen mit definitem oder indefinitem Artikel die zweite Referenz- 


situation häufiger (73%) und in artikellosen Nominalphrasen die erste (95 %). 


Ansonsten bestätigen unsere Distanzklassen die in der Dudengrammatik 


(2016: 346) beschriebene Reihenfolge. Von links nach rechts, d.h. nach abneh- 
mender Entfernung vom Kopfnomen geordnet: 


Distanzklasse 6: Adjektive, die Indefinita oder Demonstrativa nahekommen: 
besagt, weiter, sogenannt*: etwa im Beispiel weiteres (Distanzklasse 6) wochen- 
langes (Distanzklasse 5) Ringen 

Distanzklasse 5: relationale Adjektive mit Bezug auf die zeitliche Situierung: 
früher, jahrelang, anschließend: das frühere (Distanzklasse 5) obere (Distanz- 
klasse 4) Stockwerk 

Distanzklasse 4: relationale Adjektive mit Bezug auf die räumliche Lage: 
recht, inner, ober, dortig: mit dortigem (Distanzklasse 4) festem (Distanz- 
klasse 3) Wohnsitz 

Distanzklasse 3: sonstige qualifizierende Adjektive (im vorliegenden Daten- 
satz ohne eindeutigen Unterschied zwischen im Kontext tatsächlich quali- 
fizierenden Adjektiven und solchen, die als relationale Adjektive verwen- 
det werden): gemütlich, gut, angemessen, lang: mit langem (Distanzklasse 3) 
schwarzem (Distanzklasse 2) Haar 

Distanzklasse 2: Ordinalzahl- und Farbadjektive (wobei diese Stellung der Or- 
dinalzahladjektive so nah am Nomen im vorliegenden Datensatz eine Beson- 


Der Auslassungsbindestrich zeigt an, dass die Form nicht oder nur eingeschränkt prä- 
dikativ verwendbar ist, sondern üblicherweise dekliniert und attributiv vorkommt. 
Einige Adjektive wie etwa inner- haben überhaupt keine frei vorkommende Grund- 
form. 
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derheit ist, s.o.): erst, schwarz, bunt, dunkelblau: mit bunten (Distanzklasse 2) 
tibetischen (Distanzklasse ı) Fähnchen 

- Distanzklasse 1: Zugehörigkeitsadjektive (einschließlich solcher, die die geo- 
grafische Herkunft bezeichnen): demokratisch, sozial, finanziell, tibetisch, 
sächsisch 


3.2 Semantische Klasse der Adjektive (2-Klassen-System) 


Die hier angesetzte Einteilung in intersektive und nicht intersektive Adjek- 
tive orientiert sich an GDS (1997: 2000-2004), Russell (2012: 333) und Romero 
(2008). Der Grundgedanke ist, dass manche Adjektive schnittmengenbildend 
sind, manche nicht. So sind etwa „mehrstimmige Lieder“ als Schnittmenge aus 
mehrstimmigen Musikstücken („Musikstück“ als Genus proximum zu „Lied“) 
und Liedern beschreibbar. Das liegt daran, dass die Bedeutung von mehrstim- 
mig unabhängig von der Bedeutung von Lied interpretiert werden kann: Das 
Adjektiv mehrstimmig ist intersektiv. Ist aber von langen Liedern die Rede, 
so funktioniert der Schnittmengentest nicht: Ein langes Lied ist nicht per se 
ein langes Musikstück, denn lange Lieder können kürzer sein als kurze Sin- 
fonien. Um das Adjektiv lang richtig zu interpretieren, muss man die Bedeu- 
tung des Ausdrucks kennen, den es modifiziert, hier Lied. Damit ist lang wie 
viele im Kontext steigerbare Adjektive (schwierig, hart, fein, breit, schwer) nicht 
intersektiv. 

Auch bei den privativen Adjektiven (die hier ebenfalls unter die nicht inter- 
sektiven Adjektive gerechnet werden) wie etwa scheinbar kann keine Schnitt- 
menge gebildet werden: Ein „scheinbares Lied“ ist eben kein Lied und kann 
darum auch nicht in einer Schnittmenge aus scheinbaren Musikstücken und Lie- 
dern enthalten sein. 

Unter „intersektiv“ fassen wir im Folgenden auch die klassifizierenden Adjek- 
tive, die im Sinne von Zifonun (vgl. 2017b: 25) teilmengenbildend (subsektiv) 
sind, wie etwa familiär, körperlich, politisch oder auch privat; vgl. carnivorous als 
Beispiel für Intersektivität bei Romero (2008: 16). Ein „familiärer Hintergrund“ 
ist in diesem Sinne die Schnittmenge aus familiären Angelegenheiten und mög- 
lichen Hintergründen, „körperliches Unwohlsein“ ist die Schnittmenge aus kör- 
perlichen Empfindungen/Zuständen und Unwohlsein, „gedrechseltes Holz“ ist 
die Schnittmenge aus gedrechselten Werkstücken und Holz. 

Ein weiterer Test, mit dem sich die beiden Gruppen von Adjektiven abgren- 
zen lassen, ist: Dieses Stück ist lang für ein Lied, Dieses Holz ist hart für Holz (lang, 
hart sind nicht intersektiv), aber *Dieses Stück ist mehrstimmig für ein Lied, *Die- 
ses Holz ist gedrechselt für Holz (mehrstimmig, gedrechselt sind intersektiv; vgl. 
Demonte 2019: 389). 
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Aus der Beschreibung der Tests, die bei der manuellen Belegannotation 
durchgeführt wurden, wird ersichtlich: Wie viele semantische Beurteilungen hat 
auch diese eine starke subjektive Komponente. Vor allem muss zur Entscheidung 
in der Regel der Kontext herangezogen werden. Mit augenblicklich wache Babys 
kann die Schnittmenge aus Menschen, die augenblicklich nicht schlafen, und 
Babys gemeint sein; das Adjektiv wach unterscheidet sich in dieser Lesart nicht 
von wach in augenblicklich wache Greise und erscheint darum als intersektives 
Adjektiv. Aber in waches Gesicht bezeichnet das Adjektiv wach eine Eigenschaft, 
die in höherem oder geringerem Grade einem Gesicht zugesprochen werden 
kann und die nicht einfach das Gegenteil von schlafend ist. Ohne das Substantiv 
Gesicht kann nicht verstanden werden, welche Eigenschaft gemeint ist. Hier ist 
wach eher nicht intersektiv. 

Nicht intersektive Adjektive stehen im vorliegenden Datensatz’ eher vor 
intersektiven (79% der Belege, in denen die Adjektive unterschiedlichen seman- 
tischen Klassen angehören; Tab. 3 in Abschnitt 3.3): 


(5) a. mit schwierigem familiärem Hintergrund (Süddeutsche Zeitung, 
13.11.2004, S. V 1/21) 
b. aus hartem, gedrechseltem Holz (Hannoversche Allgemeine, 1.3.2008, 


S. 5) 
c. mit geringfügigem körperlichen Unwohlsein (St. Galler Tagblatt, 


20.5.2000, O. S.) 


Unter diese Regel fällt wohl auch die Tendenz der Farbadjektive, rechts von den 
übrigen qualitativen Adjektiven zu stehen (eine eingehende Diskussion, ob Farb- 
adjektive tatsächlich intersektiv sind, findet sich in GDS (vgl. 1997: 2003-2004): 


5 Dyer (2017: 24) behandelt diese Regularität sogar als eine mögliche Universalie. Er 
spricht ihr Erklärungskraft ab, räumt aber ein, dass ihre Einbeziehung seine eige- 
nen Entropieberechnungen eventuell hätte exakter machen können (Dyer 2017: 
150). Für das Englische postuliert Truswell (2009: 527): „Subsective adjectives pre- 
cede intersective adjectives“ und „Intersective adjectives do not precede subsective 
adjectives“. Seine Ergebnisse basieren auf einer Google-Recherche. Gezählt wur- 
den anders als in der vorliegenden Studie nur Belege, die als akzeptabel bewer- 
tet wurden, und die Informationsstruktur wurde kontrolliert (Truswell 2009: 526). 
Diesen Ergebnissen widersprechen Trotzke & Wittenberg (2019: 278-279): In ihrer 
Studie, die auf Google Ngram (also auf dem Datenbestand von Google Books) 
basiert, gibt es mehr Belege für die Reihenfolge intersektiv - subsektiv als für die 
Reihenfolge subsektiv - intersektiv. Woher diese sehr unterschiedlichen Ergeb- 
nisse kommen, diskutieren sie nicht. Möglicherweise ordnen sie andere Adjektive 
als intersektiv ein. 
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(6) a. mit feinem weißen Sand (Rhein-Zeitung, 28.5.1998, o. S.) 
b. mit breitem grünen Streifen (Potsdamer Neuste Nachrichten, 
10.4.2012, 0. S.) 
c. aus schwerem, weinrotem Damast (Rhein-Zeitung, 23.1.2008, o. S.) 


Aber auch die umgekehrte Reihenfolge intersektiv - nicht intersektiv kommt 
vor, ohne auffällig zu wirken: 


(7) mit gesenktem, wachem Gesicht (Lenz: Die Auflehnung, 1999 [1994], 
S. 343) 


3.3 Interaktion semantische Klasse - Komma JA/NEIN 


Allgemein kann man davon ausgehen, dass die Wortstellung freier ist, wenn 
beide Adjektive gleichermaßen das Nomen modifizieren (vgl. fürs Englische 
Davidse & Breban 2019: 347-348). Ein Anzeichen für eine solche Koordination 
von Adjektiven (eine gereihte Struktur) ist das Komma zwischen beiden Adjekti- 
ven (vgl. Münzberg & Hansen in dieser Ausgabe): mit gesenktem, wachem Gesicht. 
Demgegenüber ist bei der gestuften Struktur (das erste Adjektiv modifiziert die 
Gesamtheit aus zweitem Adjektiv und Nomen) die Reihenfolge der Adjektive 
semantisch festgelegt. Daher beschränken Eichinger (1991) sowie Kotowski & 
Härtl (2019) ihre Untersuchungen ausdrücklich auf gestufte Strukturen bzw. auf 
Strukturen ohne Komma. 


Tabelle 3: Adjektivreihenfolge nach Semantik der Adjektive in Kontexten mit und ohne 
Komma. 


Abfolge Komma 

nein ja z 
nicht intersektiv < intersektiv (Normalabfolge) 711 93 804 
intersektiv < nicht intersektiv 144 73 217 
x 855 166 1.021 


Bei der statistischen Modellierung wurde die Beziehung zwischen den Variablen 
„Komma“ und „Semantik“ (2-Klassen-System) als Interaktion berücksichtigt. Das 
Ergebnis fällt deutlich aus: Während in Fällen ohne Komma ein intersektives 
Adjektiv eine sehr starke Tendenz hat, nach einem nicht intersektiven Adjek- 
tiv aufzutreten, ist diese Tendenz für Fälle mit Komma deutlich weniger ausge- 
prägt (vgl. den geschätzten Effekt für die entsprechende Interaktion im Anhang, 
Tab. 5). 
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Ein Beispiel für die Normalabfolge nicht intersektiv - intersektiv in einer 
Nominalgruppe mit Komma zwischen den beiden Adjektiven ist (8). 


(8) mit dichtem, wollenem Unterfell (Rhein-Zeitung, 9.1.2006, o. S.) 


Die seltenere Reihenfolge intersektiv - nicht intersektiv ist in Strukturen mit 
Komma (Beispiel 9) wahrscheinlicher als in Strukturen ohne Komma. 


(9) inmitten lautlosem, dichtem Schneefall (Grass: Die Blechtrommel, 1964 
[1962], S. 103) 


3.4 Partizip 


Der Beleg (7) mit gesenktem, wachem Gesicht ist ein Beispiel dafür, dass Partizi- 
pien eher vor Nichtpartizipien stehen (vgl. Sommerfeldt 1971: 15). Bei Partizi- 
pien I in Kombination mit Nichtpartizipien macht in unseren Daten die Reihen- 
folge Partizip - Nichtpartizip 77% der Fälle aus, bei Partizipien II 69 % der Fälle. 
Ein Beispiel für die Reihenfolge Partizip I - Nichtpartizip ist (10). 


(10) mit anschließendem gemütlichen Beisammensein (Mannheimer Morgen, 
17.8.2013, S. 16) 


Der Grund für diesen Wortstellungseffekt könnte im semantischen Potenzial 
von Partizipien gesucht werden. Partizipien können assertorisch (einen Sach- 
verhalt behauptend) modifizieren und möglicherweise deswegen links stehen 
(zur Definition von „assertorisch“ vgl. Murelli 2016: 1808; im Fokus stehen dort 
ausgebaute Partizipialphrasen mit Komplementen und ggf. Supplementen, die 
in ihrer Funktion Relativsätzen nahekommen, vgl. Murelli 2016: 1811-1812). 
Etwa der Ausdruck das von keinem der Zuschauer erwartete Tor kann nur auf 
ein Tor zutreffen, für das gilt: Der Sachverhalt „Das Tor wurde von keinem 
der Zuschauer erwartet“ wird behauptet (vgl. Zifonun 2017a: 1737). Aber auch 
„unerweiterte Partizipialattribute“ (Murelli 2016: 1837) können assertorisch sein 
(der verschossene Elfmeter). 

Im vorliegenden Datensatz gibt es nur 20 Beispiele für adverbial erweiterte 
Partizipialattribute. Eines davon, das als assertorisch gelesen werden kann, fin- 
det sich in (11). 


(11) nach nun vorgenommenem erfolgreichem Eingriff (Vorarlberger Nachrich- 
ten, 18.1.1997, S. D12) 
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Partizipien können allerdings auch wie andere attributive Adjektive qualifizie- 
rend oder klassifikatorisch gebraucht werden. Die klassifikatorische Lesart ist im 
Deutschen seltener (vgl. Murelli 2017: 1811; ein Beispiel dort: stehende Gewässer). 
Nach Engel (1988: 635) sind unter den qualifikativen Adjektiven „auch die meis- 
ten attributiv gebrauchten Partizipien“ einzuordnen. Tatsächlich wird auch im 
Großteil der hier untersuchten Belege das Partizip eher qualifizierend gebraucht. 
Vor allem als Adjektive lexikalisierte Partizipien (ansprechend, begeistert) können 
qualifizierend sein (12). 


(12) a. mit ansprechendem kulinarischen Angebot (Berliner Morgenpost, 
19.6.1999, S. 13) 
b. mit begeistertem, minutenlangem Beifall (Mannheimer Morgen, 
22.5.1996, O. S.) 


Wenn nun lexikalisierte Partizipien (steigerbare, mit un- präfigierbare und/ 
oder als Adjektiv in den Duden online aufgenommene Partizipien) oft qualifi- 
zierend sind, wäre vielleicht zu erwarten, dass lexikalisierte Partizipien tenden- 
ziell weiter links stehen als nicht lexikalisierte. Andererseits wiederum - und 
das könnte diese Erwartung neutralisieren - sind lexikalisierte Partizipien als 
Adjektive den „gewöhnlichen“ Adjektiven, also den Nichtpartizipien, ähnlicher 
als Partizipien, die noch nicht als Adjektive lexikalisiert sind. Unsere Ausgangs- 
hypothese lautete daher: Die nicht lexikalisierten Partizipien stehen am häu- 
figsten links, gefolgt von den lexikalisierten Partizipien und schließlich den 
Nichtpartizipien. 

Wie Tabelle 4 zeigt, trifft dies auf ca. 72% der 370 Belege zu, in denen die 
beiden Adjektive zu unterschiedlichen Kategorien (lexikalisiertes Partizip, nicht 
lexikalisiertes Partizip, Nichtpartizip) gehören. 


Tabelle 4: Verteilung der Abfolgen von lexikalisierten Partizipien, nicht lexikalisierten 
Partizipien und Nichtpartizipien („<“ zu lesen als „geht voran“). Einteilung in erwartete 
und unerwartete Abfolgen gemäß der Hypothese „nicht lexikalisierte Partizipien stehen 
am häufigsten links, gefolgt von lexikalisierten Partizipien, gefolgt von Nichtpartizipien“. 


Abfolge Belege 
lexikalisiertes Partizip < Nichtpartizip 161 
erwartet nicht lexikalisiertes Partizip < Nichtpartizip 102 
nicht lexikalisiertes Partizip < lexikalisiertes Partizip 2 
Nichtpartizip < lexikalisiertes Partizip 69 
unerwartet lexikalisiertes Partizip < nicht lexikalisiertes Partizip 3 
Nichtpartizip < nicht lexikalisiertes Partizip 33 
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Der Datensatz enthält nur 5 Belege für die Kombination eines lexikalisierten 
Partizips mit einem nicht lexikalisierten. Bei der Kombination eines Partizips 
mit einem Nichtpartizip unterscheiden sich lexikalisierte und nicht lexikalisierte 
Partizipien kaum, der Anteil an erwarteten Abfolgen liegt bei 70% respektive 
ca. 76%. Die Differenz ist bei einer Stichprobengröße von 365 zu klein, um von 
einem tatsächlichen Unterschied auszugehen.‘ Aus diesem Grund verzichten wir 
im Folgenden auf die Unterscheidung zwischen lexikalisierten und nicht lexi- 
kalisierten Partizipien und berücksichtigen bei der statistischen Modellierung 
nur die Unterscheidung zwischen Partizipien einerseits und Nichtpartizipien 
andererseits. 

Diejenigen Partizipien, die qualifizierend gebraucht werden, stehen in der 
Grundreihenfolge referenziell - qualitativ - klassifikatorisch links vor den 
(klassifizierenden) Zugehörigkeitsadjektiven. Auch könnte man annehmen, 
dass Assertorisches in der Regel allgemein weiter entfernt vom Kopfnomen 
steht als Klassifikatorisches und wohl auch weiter entfernt als Attribute mit 
qualitativer Lesart, vgl. (jetzt vom Kopfnomen aus nach rechts): die Kita in 
der Mühltalstraße (klassifikatorisch), die unser Sohn besucht (assertorisch); 
eine Bergkulisse von unglaublichem Reiz (qualitativ), die schon oft fotografiert 
worden ist (assertorisch). Dass assertorisch modifizierende Partizipialattribute 
in gestuften Strukturen links vom Kopfnomen meist vor anderen Adjektiv- 
attributen stehen, stimmt mit dieser Annahme überein. Vielleicht wirkt schon 
die grundsätzliche Möglichkeit, Partizipien assertorisch zu verwenden, auf die 
Wortstellung ein. 

Eine zusätzliche Stichprobe im ersten Achtel des Untersuchungskorpus 
ergibt für die Struktur „erweitertes Partizipialattribut - kein Komma und keine 
Konjunktion - attributives Adjektiv“ (Beispiel: ein an der Kreuzung Waterloo- 
straße / Wabestraße abgestellter roter Alfa Romeo) ca. 27 Belege / 1 Mio. Tokens, 
für die Reihenfolge „attributives Adjektiv - kein Komma und keine Konjunk- 
tion - erweitertes Partizipialattribut“ nur rund 2 Belege / 1 Mio. Tokens. Für die 
Struktur „erweitertes Partizipialattribut - Komma oder Konjunktion - Adjektiv“ 
sind es auch nur ca. 2 Belege / ı Mio. Tokens, während die Reihenfolge „Adjek- 
tiv - Komma oder Konjunktion - erweitertes Partizipialattribut“ (Beispiel: ein 
langjähriger, für das rot-rot-grüne Projekt 2017 fest eingeplanter Koalitionspartner) 
rund 7-mal / Mio. Tokens vorkommt. Nun nehmen wir an, dass Strukturen ohne 
das Oberflächenmerkmal Komma in der Regel gestuft sind und Strukturen mit 


6  7(1, 365) = 1,04, p = 0,31. Bei gleichzeitiger Betrachtung mit anderen möglichen Ein- 
flussgrößen in einem logistischen Regressionsmodell wird ebenfalls kein Unterschied 
zwischen lexikalisierten und nicht lexikalisierten Partizipien deutlich. Dies ändert 
sich auch dann nicht, wenn potenziell korrelierende Variablen (Intersektivität und 
Silbenzahl) aus dem Modell entfernt werden. 
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Komma in der Regel gereiht (Münzberg & Hansen in dieser Ausgabe). Das würde 
bedeuten: In gestuften Strukturen steht das erweiterte Partizip eher vor einem 
anderen Adjektiv, in gereihten eher danach. 


3.5 Silbenzahl 


Adjektive mit mehr Silben’ stehen im vorliegenden Datensatz in der Regel nach 
Adjektiven mit weniger Silben (13). Es scheint also das „Gesetz der wachsenden 
Glieder“ (Behaghel 1909:139; vgl. auch Behaghel 1932: 6 = § 1416) zu wirken. 


(13) a. mit großem, verwildertem Garten (Frankfurter Rundschau, 21.8.1997, 
S. 12) 
b. mit wildem, riicksichtslosem Gerangel (Die Zeit [Online-Ausgabe], 
22.2.2007, O. S.) 


Hier sind jedoch kategorische Kontexte und Wahlkontexte zu unterscheiden. So 
kann das erste Adjektiv die Gesamtheit aus zweitem Adjektiv und Nomen modi- 
fizieren (gestufte Struktur, vgl. Münzberg & Hansen in dieser Ausgabe). Wenn die 
Schreibenden eine solche Struktur intendieren, spielt die Silbenzahl keine Rolle. 
Es handelt sich um einen kategorischen Kontext, der von der Semantik bzw. von 
der internen Struktur der Nominalphrase bestimmt ist. Daher stehen qualifizie- 
rende Adjektive auch dann eher vor Zugehörigkeitsadjektiven (s. Abschnitt 3.1), 
wenn sie länger sind als diese: 


(14) mit augenzwinkerndem britischen Humor (Die Presse, 12.4.1994, 0. S.) 
Auch im Beispiel (15) wirkt wohl nicht das Gesetz der wachsenden Glieder. 
(15) mit enormem finanziellen Aufwand (Süddeutsche Zeitung, 21.12.1992, S. 0) 


Zwar ist das zweite Adjektiv wie zu erwarten länger als das erste. Das ist aber 
wahrscheinlich nicht der Grund für die Wortstellung. Vielmehr ist enorm ein qua- 
lifizierendes Adjektiv und finanziell ein Zugehörigkeitsadjektiv. Auch hier gibt 
ein kategorischer Kontext die Reihenfolge vor. Nicht behauptet werden soll, dass 
alle Kontexte mit qualitativen Adjektiven und i. d. R. als Zugehörigkeitsadjektive 


7 Ermittelt mithilfe eines Algorithmus, der grundsätzlich pro Vokal eine Silbe ausgibt, 
wobei aber bestimmte Vokalbuchstabenkombinationen als eine Silbe gerechnet wer- 
den. Beispiele für solche Kombinationen: /ai/ außer in etwaig, archaisch, /ee/ außer in 
ideenreich. 
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einzuordnenden Adjektiven per se kategorische Kontexte mit gestuften Struktu- 
ren sind; entscheidend ist immer die Äußerungsabsicht. Nun sind die für gestufte 
Strukturen typischen Zugehörigkeitsadjektive in der Regel länger (meist auch 
komplexer) als qualitative Adjektive; vgl. Eichinger (1991). Damit entsprechen 
solche Belege zwar dem „Gesetz der wachsenden Glieder“, aber in diesen kate- 
gorischen Kontexten wirken vor allem das erste Behaghel’sche Gesetz, nach 
dem „das geistig eng Zusammengehörige auch eng zusammengestellt wird“ 
(Behaghel 1932: 4 = $ 1426), und das dritte, nach dem „das unterscheidende Glied 
dem unterschiedenen vorausgeht“ (Behaghel 1932: 5 = § 1426). 

Irrelevant ist das „Gesetz der wachsenden Glieder“ darum nicht. Betrach- 
ten wir die insgesamt 307 Fälle, in denen die Adjektive als tauschbar markiert 
worden sind (z.B. bei aufeinanderfolgenden qualifizierenden Adjektiven). Das 
sind Wahlkontexte, in denen das „Gesetz der wachsenden Glieder“ nicht von den 
beiden semantischen Gesetzen eins und drei überlagert werden kann. In dieser 
Teilmenge des Datensatzes ist in 144 Belegen das zweite Adjektiv länger als das 
erste und nur in 77 Belegen das erste Adjektiv länger als das zweite (im Rest der 
Belege ist die Silbenzahl gleich).* 


3.6 Erweiterung durch Adverbien und Partikeln 


Nach dem „Gesetz der wachsenden Glieder“ wäre auch zu erwarten, dass kom- 
plexe Adjektivgruppen (mit Ausnahme der erweiterten Partizipialattribute in 
gestuften Strukturen, vgl. Abschnitt 3.4) einfachen eher nachfolgen. Ein Bei- 
spiel für eine gereihte Struktur, in der die beiden Adjektivgruppen als prinzipi- 
ell tauschbar (vgl. Abschnitt 2) markiert worden sind und die dieser Erwartung 
entspricht, ist (16). 


(16) mit neuem, teilweise gewagtem Glanz (Mannheimer Morgen, 7.11.2008, 
S. 21) 


Wie im Falle der Silbenzahl (Abschnitt 3.5) muss auch diese Hypothese auf Falle 
eingeschrankt werden, in denen die Semantik keine zwingende Reihenfolge vor- 
gibt. Im folgenden Beleg könnte das intersektive Zugehörigkeitsadjektiv thera- 
peutischen (bzw. die starke Form therapeutischem) kaum vor die Adjektivgruppe 
mit dem nicht intersektiven qualifizierenden Adjektiv geringem gestellt werden: 


(17) mit nur geringem therapeutischen Nutzen (Frankfurter Rundschau, 
29.10.1999, S. 13) 


8 x°(1, 221) = 20,3, p < 0,001. 
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Daher kann aus den absoluten Zahlen - 56 erweiterten ersten Adjektiven ste- 
hen 27 erweiterte zweite Adjektive gegenüber - nicht direkt geschlossen wer- 
den, dass das „Gesetz der wachsenden Glieder“ hier unwirksam, die Hypothese 
also falsch ist. Denn bei den Adjektiven, die als tauschbar markiert worden sind, 
überwiegen wieder 19 erweiterte zweite Adjektive 12 erweiterte erste Adjektive. 
Kontrolliert man jedoch wie in dem Regressionsmodell, das im Anhang beschrie- 
ben ist, andere relevante Variablen, ist der Effekt anhand unseres Datensatzes 
nicht mehr nachweisbar. 


3.7 Frequenzphänomene 


Ein Unterschied in den Frequenzklassen’ der beiden Adjektive begünstigt das 
Auftreten des selteneren Adjektivs näher am Nomen. Frequente Adjektive ste- 
hen also tendenziell vor weniger frequenten (vgl. auch fürs Englische Trotzke & 
Wittenberg 2019: 278). 

Das zweite verwendete Frequenzmaß ist die substantivspezifische Adjektiv- 
frequenz, d.h. die bedingte Wahrscheinlichkeit für das Auftreten des Adjektivs 
mit einem gegebenen Substantiv. Für das Englische konnte hier ein deutlicher 
Einfluss auf die Wortstellung nachgewiesen werden: Wulff (vgl. 2003: 267) 
errechnet für englische Adjektiv-Substantiv-Folgen die Frequenz des Vorkom- 
mens von attributivem Adjektiv und Substantiv zusammen geteilt durch die Fre- 
quenz des Substantivs. Je höher der Wert für ein Adjektiv ist, desto größer die 
Wahrscheinlichkeit, dass dieses Adjektiv als zweites von zwei aufeinanderfol- 
genden Adjektiven (also nah beim Nomen) steht. Ein Fall aus dem vorliegenden 
Datensatz, auf den diese Vorhersage zutrifft, wäre (18). 


(18) Der klassische Hans-Poelzig-Bau aus dem Jahr 1929 wird endlich in altem, 
neuen Glanz erstrahlen. (Berliner Zeitung, 27.4.2000, S. 3) 


Das Adjektiv alt kommt im 7-Mrd.-Untersuchungskorpus 2.835-mal attributiv zu 
Glanz vor. Das Adjektiv neukommt viel häufiger zusammen mit Glanz vor, näm- 
lich 16.973-mal. Das Substantiv Glanz ist 78.573-mal im 7-Mrd.-Korpus vertreten. 
2.835 geteilt durch 78.573 ergibt gerundet 0,0361. Das ist die Wahrscheinlichkeit 


9 Fir die meisten Adjektivlexeme liegen DeReWo-Frequenzklassen vor: „Dabei hat eine 
Grundform die Häufigkeitsklasse N, wenn die häufigste Form etwa 2“-mal häufiger 
vorkommt als diese Form. [...] Für die Grundformenliste ist der Eintrag mit der höchs- 
ten Frequenz ‚der, die, das‘ (Belica et al. 2012, 2.5 „Häufigkeitsklassen“). Das bedeutet: 
Je höher die Frequenzklasse, desto seltener das Wort. Fehlende Frequenzklassen wur- 
den nachgetragen. 
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für das Auftreten von alt, wenn Glanz gegeben ist. Für neu ist der Wert höher, er 
beträgt 0,2160. Das kann einer der Gründe dafür sein, dass das Adjektiv neu in 
Beleg (18) näher am Nomen steht - aber rechnerisch lässt sich das anhand des 
Datensatzes ATTRIBUTIVE_ADJEKTIVE_1 nicht nachweisen. Für die vorliegende 
Studie wurde die Differenz der entsprechenden Werte für die beiden beteiligten 
Adjektive verwendet, jedoch konnten wir anhand unseres Datensatzes keinen 
Effekt feststellen. 

Wichtiger ist die substantivspezifische Adjektivfrequenz im vorliegenden 
Datensatz für die starke/schwache Flexion des zweiten Adjektivs (vgl. Münzberg 
& Hansen in dieser Ausgabe). 

Die beiden untersuchten Frequenzmaße (d.h. Frequenzklasse und subs- 
tantivspezifische Adjektivfrequenz) können zu gegensätzlichen Vorhersagen 
hinsichtlich der Adjektivstellung führen. Der Grund dafür ist, dass die subs- 
tantivspezifische Adjektivfrequenz nicht die absolute Frequenz des Adjektivs 
berücksichtigt. So ist für ein allgemein sehr häufig vorkommendes Adjektiv 
auch erwartbar, dass es zusammen mit einem gegebenen Substantiv häufiger 
vorkommt als ein allgemein selteneres Adjektiv. Die Frequenzklasse des häufige- 
ren Adjektivs lässt dann vermuten, dass es an erster Position steht, die substan- 
tivspezifische Adjektivfrequenz würde dagegen vorhersagen, dass es die zweite 
Position einnimmt. 


3.8 Lexikalisches 


Auch wenn man alle anderen oben beschriebenen Einflussfaktoren berücksich- 
tigt, zeigen verschiedene Kandidatenlexeme ein unterschiedliches Stellungs- 
verhalten (hier modelliert als zufälliger Effekt; im Anhang unter 5.4 findet sich 
eine detailliertere Darstellung). Die Varianz zwischen individuellen Lexemen 
ist verhältnismäßig hoch, und welche Position ein Adjektiv einnimmt, wird 
nicht unwesentlich durch lexikalische Idiosynkrasien bestimmt. Möglicher- 
weise ließe sich ein Teil dieser Variabilität weiter aufklären, indem zusätzliche 
Eigenschaften von Adjektivlexemen berücksichtigt werden. Beispiele könnten 
sein: der Wortbildungstyp auch bei Nichtpartizipien, das Alter des Adjektivs, 
der Polysemiegrad und andere mehr. Weitere Einflussgrößen könnten die rela- 
tive Häufigkeit komparierter Formen im Gesamtkorpus und die relative Häu- 
figkeit der prädikativen Verwendung im Gesamtkorpus sein (zu beidem vgl. 
Abschnitt ı) sowie das Vorkommen in bestimmten Textsorten. Bei der Berück- 
sichtigung so vieler Einflussgrößen wären dann typische Merkmalbündel wie 
gut komparierbar, gut prädikativ verwendbar, Simplex, alt, in allen Textsorten 
vorkommend, hochgradig polysem zu bedenken, denn dadurch entstehen 
Korrelationen. 
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4 Zusammenfassung 
Dafür, dass links vom Kopfnomen ein attributives Adjektiv B nach einem attributi- 


ven Adjektiv A steht, also näher am Nomen, spricht neben dem konkreten Adjek- 
tivlexem B (vgl. Abschnitt 3.8) (nach abnehmender Stärke der Effekte geordnet), 


Sem. = INT_NON — 
Konkurrent Partizip = JA —— 
Komma = JA — 


Sem. = NON_NON 
Diff. Silbenzahl = POSITV =g 
Diff. Frequenzklasse = POSITIV _—— 
Diff. SAF = POSITIV 

Konkurrent mit Adverb = JA 
Sem. = NON_INT & Komma = JA 


Kandidat mit Adverb = JA 


Sem. = NON_INT —— 
Sem. = NON_NON & Komma = JA i—i 
Kandidat Partizip = JA —— 
Sem. = INT_NON & Komma = JA ——1ı 
T T T T T 
-4 -2 0 2 4 


geschätzter Koeffizient (Logit) 
Position 1 — — Position 2 


Abb. 1: Koeffizientenschätzungen und 95 %-Konfidenzintervalle für das gemischte 
logistische Regressionsmodell. Positive Koeffizienten erhöhen die Wahrscheinlichkeit, 
dass das Kandidatenadjektiv an zweiter Position steht. Erläuterungen zu den einzelnen 
Prädiktoren finden sich im Anhang. Die Faktoren Sem. und Komma beziehen sich 

auf die Referenzauspragung des jeweils anderen Faktors (Komma = nein bzw. Sem. = 
INT_INT); bei anderen Ausprägungen sind zusätzlich die entsprechenden Interaktions- 
terme zu beachten. Legende: Sem. = int_non: Der Kandidat (das betrachtete Adjektiv) 
ist intersektiv, der Konkurrent (das andere Adjektiv) nicht. Konkurrent Partizip = ja: 
Der Konkurrent ist ein Partizip. Komma = ja: Zwischen den beiden Adjektiven steht ein 
Komma. Sem. = non_non: Keines der beiden Adjektive ist intersektiv. Diff. Silbenzahl = 
positiv: Der Kandidat hat mehr Silben als der Konkurrent. Diff. Frequenzklasse = positiv: 
Der Kandidat ist seltener als der Konkurrent. Diff. SAF = positiv: Der Kandidat kommt 
häufiger als der Konkurrent attributiv zum Nomen vor. Konkurrent mit Adverb = ja: 
Erweiterung des Konkurrenten durch ein Adverb wie in ziemlich großem. Sem. = NoN_INT 
& Komma = Ja: Interaktion semantische Klasse (Kandidat nicht intersektiv, Konkurrent 
intersektiv) mit Komma (ja). Kandidat mit Adverb = ja: Erweiterung des Kandidaten 
durch ein Adverb. Sem. = non_ınt: Der Kandidat ist nicht intersektiv, der Konkurrent ist 
intersektiv. Sem. = Non_Non & Komma = ja: Interaktion semantische Klasse (keines der 
beiden Adjektive ist intersektiv) mit Komma (ja) Kandidat Partizip = ja: Der Kandidat ist 
ein Partizip. Sem. = int_Non & Komma = ya: Interaktion semantische Klasse (der Kandi- 
dat ist intersektiv, der Konkurrent nicht) mit Komma (ja). 
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- dass Adjektiv B intersektiv verwendet wird und Adjektiv A nicht; das Vor- 
handensein eines Kommas wirkt diesem Effekt jedoch stark entgegen, 

- dass Adjektiv A ein Partizip ist, 

- dass Adjektiv B mehr Silben hat als Adjektiv A, 

- dass Adjektiv B seltener ist (höhere Frequenzklasse) als Adjektiv A. 


Dafür, dass Adjektiv B an erster Stelle steht, also weiter entfernt vom Nomen, 
spricht (nach abnehmender Stärke der Effekte geordnet), 

- dass Adjektiv B selbst ein Partizip ist, 

- dass Adjektiv A intersektiv verwendet wird und Adjektiv B nicht. 


5 Anhang 


Für die statistische Modellierung mussten 5 Belege aus dem Datensatz ausge- 
schlossen werden, da die Frequenzklasse der Adjektive nicht ermittelbar war. 
Die semantische Klasse von Kandidat und Konkurrent (2-Klassen-System) wurde 
in einer Variable mit den vier Ausprägungen INT_INT, INT_NON, NON_INT und 
NON_NON zusammengefasst (jeweils Kandidat_Konkurrent, mit INT = intersek- 
tiv, NON = nicht intersektiv). Die Variablen „Differenz Silben“, „Differenz Fre- 
quenzklasse“ und „Differenz substantivspezifische Adjektivfrequenz“ wurden 
dichotomisiert und als Faktoren kodiert, jeweils mit den Ausprägungen POSITIV 
(Kandidat > Konkurrent) und nicHT-PosITIv (Kandidat < Konkurrent). 


5.1 Modellspezifikation 


Es wurde ein gemischtes logistisches Regressionsmodell wie folgt spezifiziert: 


P(y; = 1) = logit” (aj; + Po + DiffSilben; x pı + DiffSAF; x Pa + DiffFreq: x Ps 
+ KandAdv; x B, + KonkAdv; x Ps + KonkPartizip; x ps 


+ Sem; x P, + Komma; x P + Komma; x Sem; x Po) 
mit 


aj ~ N(yo + KandPartizip; x yı Oa) 


Abbildung 2: Modellspezifikation, logistische Regression mit festen und zufälligen Effek- 
ten (hierarchisches Modell mit variablen Intercepts für die Gruppe der Kandidatenlem- 
mata). Die Notation ist hier abgekürzt, für einen Faktor mit n Ausprägungen werden n-1 
Koeffizienten geschätzt. Statt B und By werden also tatsächlich jeweils drei Koeffizien- 
ten geschätzt. Die Zusammenfassung in Tab. 5 macht dies deutlich. 
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Das Logit der Wahrscheinlichkeit, dass im Fall i das Kandidatenadjektiv an 
zweiter Position steht (also näher am Nomen), wird dabei modelliert als lineare 
Kombination der Prädiktoren „Differenz Silben“ (DiffSilben), „Differenz subs- 
tantivspezifische Adjektivfrequenz* (DiffSAF), „Differenz Frequenzklasse“ (Diff- 
Freq), „Kandidat mit Adverb“ (KandAdv), „Konkurrent mit Adverb“ (KonkAdv), 
„Konkurrent ist Partizip“ (KonkPartizip), „semantische Klasse von Kandidat und 
Konkurrent“ (Sem), „Komma“ sowie dem Produkt von „semantischer Klasse“ und 
„Komma“ (Interaktion). Außerdem enthält das Modell eine je nach Kandidaten- 
lexem j variierende Konstante œj. Diese lexemspezifischen Konstanten werden 
ihrerseits mittels einer einfachen linearen Regression vorhergesagt, in der die 
Variable „Kandidat ist Partizip“ (KandPartizip) als Prädiktor dient. 


5.2 Interpretation 


Die Parameter in diesem Modell wurden in R (R Core Team 2019) mit dem Ime4- 
Paket (Bates et al. 2015) auf einer Datengrundlage von 1.593 Belegen geschätzt. 
Tab. 5 zeigt die Koeffizientenschätzungen. Auf der hier dargestellten Ebene der 
Logits lassen sich die Beiträge eines Prädiktors unabhängig von den Ausprägun- 
gen der anderen Prädiktoren ablesen. Ausnahmen sind die Variablen Komma 
und Sem, deren Koeffizientenschätzungen wegen des Interaktionsterms nicht 
unabhängig voneinander sind und nur für die Referenzausprägung des jeweils 
anderen Faktors (Komma = NEIN bzw. Sem = INT_INT) gelten. Im Gegensatz zu 
den Logits ist die Abhängigkeit zwischen Wahrscheinlichkeit und Prädiktoren 
nicht linear. Über den Einfluss eines Prädiktors auf die Wahrscheinlichkeit las- 
sen sich deshalb genaue Aussagen nur machen, wenn die Ausprägungen aller 
anderen Prädiktoren berücksichtigt werden, d.h. nur fallweise. Auf der Ebene 
der Logits können in diesem Modell das Vorzeichen und der Betrag interpretiert 
werden: Bei Koeffizienten > o steigt die vorhergesagte Wahrscheinlichkeit dafür, 
dass das Kandidatenadjektiv an zweiter Position (näher am Nomen) steht, bei 
negativen Koeffizienten nimmt sie ab. 


5.3 Modellselektion 


Für die Koeffizienten der Variablen „Differenz substantivspezifische Adjektivfre- 
quenz“, „Kandidat mit Adverb“ und „Konkurrent mit Adverb“ liegt nicht genug 
Evidenz dafür vor, dass sie tatsächlich verschieden von null sind (die entspre- 
chenden Signifikanztests haben p-Werte > 0,05). Bei einer Modellselektion auf 
der Grundlage von Likelihood-Ratio-Tests könnten diese drei Faktoren ohne 
nennenswerte Auswirkungen auf die Modellgüte entfernt werden. Sie wurden 
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Tabelle 5: Parameterschätzungen für das verwendete gemischte Modell. 


Faktor Ausprägung | geschätzter | Std.-Fehler z p 
Koeffizient 
Diff. Silben POSITIV 0,773 0,313 2,47 0,014 
(Kand-Konk) 
Diff. SAF (Kand-Konk) POSITIV 0,278 0,249 1,12 0,264 
Diff. Frequenzklasse POSITIV 0,644 0,286 2,25 0,024 
(Kand-Konk) 
Kandidat ist Partizip A -2,046 0,429 -4,77 | < 0,001 
Konkurrent ist Partizip | JA 1,797 0,343 5,24 | < 0,001 
Kandidat mit Adverb A -1,008 0,610 -1,65 0,099 
Konkurrent mit Adverb | JA -0,640 0,730 -0,88 0,380 
Komma A 1,257 0,496 2,53 0,011 
Semantik (Kand_Konk) NT_NON 2,799 0,421 6,65 | < 0,001 
NON_INT -1,891 0,426 -4,44 | < 0,001 
NON_NON 0,934 0,563 1,66 0,097 
Komma : Semantik JA: INT_NON -3,155 0,738 -4,27 | < 0,001 
(kand_Konk) JA: NON_INT -0,755 0,690 | -1,10 | 0,274 
JA ! NON_NON -1,990 0,774 -2,47 0,014 


1.593 Beobachtungen, 726 Ausprägungen in der Gruppe Kandidatenlemma 


Standardabweichung für die lemmaspezifischen Konstanten 0, = 2,65 


hier jedoch im Modell belassen, weil zu jedem dieser Faktoren eine sprachwis- 
senschaftlich begründete Hypothese bestand (die in dieser Studie nicht erhärtet 
werden konnte) und die Auswahl eines optimalen statistischen Modells nicht im 
Vordergrund steht. 

Da im Zusammenhang mit der Adjektivflexion Auffälligkeiten bei Daten 
aus der Schweiz feststellbar sind (vgl. Münzberg & Hansen in dieser Ausgabe), 
wurde tentativ der Faktor „Land“ (dichotomisiert als SCHWEIZ, NICHT-SCHWEIZ) 
mit ins Modell aufgenommen, um eventuelle Interaktionen mit anderen Einfluss- 
größen aufzudecken. Für keine der möglichen Interaktionen zwischen „Land“ 
und anderen Faktoren gibt es jedoch hinreichende Evidenz (gemäß Likelihood- 
Ratio-Tests), sodass der Faktor „Land“ nicht weiter im Modell berücksichtigt 
wurde. Für den Einfluss anderer nicht-sprachlicher Größen (wie „Medium“ oder 
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„Register“) auf die Reihenfolge attributiver Adjektive sind uns keine Hypothesen 
bekannt, sie wurden deshalb nicht berücksichtigt. 


5.4 Zufälliger Effekt 


Ein Lexem lässt sich einerseits als Individuum betrachten, andererseits lassen 
sich ihm aber auch inhärente Eigenschaften zuschreiben. Als eine inhärente 
Eigenschaft von Lexemen wurde in dieser Studie berücksichtigt, ob eines der 
Adjektive (der „Kandidat“) ein Partizip ist bzw. aus einem Partizip gebildet wor- 
den ist. Der Einfluss individueller Lexeme lässt sich in einer Regressionsanalyse 
als Zufallseffekt modellieren, sodass (in unserem Fall) für jedes Lexem ein kons- 
tanter Wert vorhergesagt und bei der Modellierung der Adjektivstellung berück- 
sichtigt wird. Inhärente Eigenschaften eines Lexems können dazu beitragen, 
diese lexemspezifische Konstante genauer vorherzusagen: Solche Eigenschaften 
stellen die systematische Komponente bei der Vorhersage der lexemspezifischen 
Konstanten dar. Hinzu kommt eine zufällige Komponente u.a. aufgrund von 
wirklichen lexemspezifischen Idiosynkrasien und unberücksichtigten (aber im 
Prinzip systematisierbaren) inhärenten Eigenschaften der Lexeme (vgl. Gelman 
& Hill 2007: Kap. 12). 

Die unerklärte Varianz zwischen den Kandidatenlexemen - also Varianz, 
die nicht durch die lexemspezifische Eigenschaft „Kandidat ist Partizip“ erklärt 
wird - ist verhältnismäßig hoch (0, = 2,65). Ein möglicher Grund dafür ist, dass 
wichtige Einflussfaktoren auf der Gruppenebene (lexemspezifische Eigenschaf- 
ten des Kandidaten) nicht berücksichtigt wurden. 

Wenn, wie oben beschrieben, für jedes Kandidatenlexem eine eigene Kons- 
tante vorhergesagt und bei der Modellierung der Wahrscheinlichkeit verwendet 
wird, ist eine bessere Anpassung des Modells an die Daten zu erwarten. Deut- 
lich wird das beispielsweise, wenn man die Vorhersagegenauigkeit des Modells 
für die beiden diskreten Klassen „ı“ (Kandidat steht an zweiter Position) und 
„o“ (Kandidat steht nicht an zweiter Position) betrachtet. Dabei werden die vom 
Modell vorhergesagten Wahrscheinlichkeiten üblicherweise so in zwei Klas- 
sen eingeteilt, dass Wahrscheinlichkeiten > 0,5 auf „1“ abgebildet werden und 
Wahrscheinlichkeiten < 0,5 auf „o“. Durch den anschließenden Vergleich mit 
den beobachteten Daten ergibt sich der Anteil korrekt vorhergesagter Fälle. Für 
das beschriebene gemischte Modell liegt diese Vorhersagegenauigkeit bei 95 %. 
Macht man jedoch Vorhersagen für ungesehene Daten, bei denen einige Kandi- 
datenlemmata neu sind und das Modell entsprechend keinen Zufallseffekt vor- 
hersagt, fällt die Vorhersagegenauigkeit auf 80% im Mittel (bei 10-facher Kreuz- 
validierung). Das Modell generalisiert demnach weniger gut auf neue Daten und 
ein wesentlicher Teil der Variation zwischen den Kandidatenlexemen wird nicht 
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durch die lexemspezifische Eigenschaft „Kandidat ist Partizip“ erklärt. Berück- 
sichtigt man den Zufallseffekt bei der Vorhersage nicht (oder verwendet man ein 
einfaches logistisches Regressionsmodell ohne Zufallseffekt), liegt die mittlere 
Vorhersagegenauigkeit bei 74 %. 

Möglicherweise ließe sich die unerklärte Varianz zwischen den Kandidaten- 
lexemen verringern, indem zusätzliche Eigenschaften des Kandidatenlexems 
berücksichtigt werden. 

Andere Eigenschaften von Adjektivlexemen in Nominalphrasen mit zwei 
attributiven Adjektiven wurden in dieser Studie mit Bezug auf das jeweils 
andere Adjektivlexem im Beleg erfasst (z.B. die Differenz in der Silbenzahl und 
die Differenz in der Frequenzklasse). Die resultierenden Werte sind damit keine 
Eigenschaften eines einzelnen Lexems, sondern Eigenschaften eines spezifischen 
Belegs und tragen damit nicht zur Aufklärung der Varianz auf der Ebene der 
Lexeme bei. 


5.5 Modellgüte 


Ein Indikator für die Modellgüte ist der Anteil der vom Modell erklärten Vari- 
anz in den Daten. Für generalisierte lineare Modelle greift man üblicherweise 
auf eine Reihe von Pseudo-R?’-Maßen zurück. Wir berichten im Folgenden das 
im MuMin-Paket (Barton 2019) implementierte Pseudo-R? von Nakagawa et al. 
(2017). Dieses ist auch für gemischte Modelle definiert und unterscheidet zwi- 
schen Varianz, die durch die festen Effekte erklärt wird (marginales R?), und 
Varianz, die durch das gesamte Modell einschließlich der zufälligen Effekte 
erklärt wird (konditionales R’). Für das hier beschriebene gemischte Modell ist 
das marginale R? = 0,32 und das konditionale R? = 0,78. Ein Großteil der Varianz 
wird also durch den zufälligen Effekt erklärt, die festen Effekte alleine (d.h. die 
Prädiktoren im Modell) tragen nur mäßig dazu bei, die Varianz zu erklären. 

Als weiterer Anhaltspunkt zur Modellevaluierung (zumindest, was den Bei- 
trag des zufälligen Effekts betrifft) bietet sich die Vorhersagegenauigkeit an, wenn 
das Modell als Klassifikator verwendet wird. Wie in Abschnitt 5.4 angesprochen, 
werden dabei üblicherweise vom Modell vorhergesagte Wahrscheinlichkeiten 
> 0,5 auf „1“ abgebildet und alle anderen auf „o“. Durch den anschließenden Ver- 
gleich mit den beobachteten Daten ergibt sich der Anteil korrekt vorhergesagter 
Fälle. Dieser lässt sich noch ins Verhältnis setzen zum Anteil korrekt vorherge- 
sagter Fälle, den man mit einem „Nullmodell“ erhalten würde, das immer die häu- 
figere Kategorie (Kandidat steht an näher am Nomen oder Kandidat steht nicht 
näher am Nomen) vorhersagt. Im hier verwendeten Datensatz liegt dieser Anteil 
bei 50%, weil die Daten nach dem Zufallsprinzip einer dieser beiden Kategorien 
zugeordnet wurden. Der PRE-Wert (proportional reduction in error) gibt an, um 
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Tabelle 6: Mittlere Vorhersagegenauigkeit und mittlere Reduzierung des Vorhersage- 
fehlers (proportional reduction in error, PRE) bei 10-facher Kreuzvalidierung. GLMM 
entspricht dem in Abb. 2 und Tab. 5 dargestellten gemischten Modell; GLMM (ohne RE) 
entspricht demselben Modell, die Vorhersagen wurden jedoch ohne Berücksichtigung 
des zufälligen Effekts gemacht; GLM entspricht einem einfachen logistischen Regressi- 
onsmodell mit denselben unabhängigen Variablen wie in GLMM. 


Trainingsdaten Testdaten 
Genauigkeit % PRE | Genauigkeit % PRE 
GLMM 94,9 0,89 80,2 0,60 
GLMM (ohne RE) 74,6 0,49 74,1 0,48 
GLM 74,0 0,48 73,6 0,47 


welchen Anteil der Vorhersagefehler von ursprünglich 50% falsch klassifizierter 
Belege reduziert wird, wenn Prädiktoren ins Modell aufgenommen werden. Um 
eine realistischere Einschätzung darüber zu bekommen, inwieweit das Modell 
Generalisierungen erfasst hat (anstatt übermäßig Idiosynkrasien des Datensatzes 
aufzunehmen), wurde hier eine 10-fache Kreuzvalidierung durchgeführt. Dabei 
wird (iterativ) ein Teil der Daten bei der Parameterschätzung ausgelassen, und 
Vorhersagen werden anschließend für diesen nicht verwendeten Teil der Daten 
erzeugt und abgeglichen. Auch hierbei zeigt sich, dass das Modell für ungese- 
hene Datenpunkte, insbesondere solche mit bisher ungesehenen Kandidatenlem- 
mata, weniger genaue Vorhersagen macht. Die Vorhersagegenauigkeit liegt im 
Mittel bei 80,2% für die Testdaten (94,9% für die Trainingsdaten), der mittlere 
PRE-Wert beträgt 0,6 für die Testdaten (0,89 für die Trainingsdaten), d.h., der 
Vorhersagefehler wird aufgrund der im Modell enthaltenen Prädiktoren um 60 % 
gegenüber dem Nullmodell reduziert. Werden die Vorhersagen ohne Berücksich- 
tigung des zufälligen Effekts gemacht, liegt die Genauigkeit bei 74,1 % (Testdaten) 
bzw. 74,6% (Trainingsdaten), der Unterschied fällt hier erwartungsgemäß deut- 
lich geringer aus. Der PRE-Wert liegt in diesem Fall bei 0,48. Die verbesserte 
Vorhersagegenauigkeit bei Berücksichtigung des zufälligen Effekts ist vor allem 
darauf zurückzuführen, dass in den Testdaten in der Regel mehr als die Hälfte der 
Datenpunkte ein Kandidatenlemma haben, das auch in den Trainingsdaten vor- 
handen ist. Darüber hinaus hat die Modellierung mit einem zufälligen Effekt hier 
möglicherweise auch eine verbesserte Schätzung der festen Effekte zur Folge. 

Tab. 6 fasst diese Daten zusammen und zeigt den Vergleich zu einem einfa- 
chen GLM ohne zufälligen Effekt. 
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